Категория

Софт

SlideFormer: новый подход к тонкой настройке больших языковых моделей на одном GPU
AI и нейросети

SlideFormer: новый подход к тонкой настройке больших языковых моделей на одном GPU

Тонкая настройка больших языковых моделей (LLM) становится всё более важной для адаптации к конкретным задачам, но её высокая требовательность к памяти превышает возможности большинства современных GPU. Разработчики из Гонконгского университета науки и технологий (Hong Kong University of Science and

i
iXBT2 мин чтения