Закрыть
10:33, 7 марта 2025

Китайский прорыв в ИИ: Deepseek повышает эффективность обучения нейросетей

Новые модели Deepseek-V3 и Deepseek-R1, разработанные китайской компанией, демонстрируют сопоставимую с OpenAI точность при значительно меньших затратах на обучение, что может ознаменовать новую фазу развития искусственного интеллекта.

Создано с помощью GigaChat

Китайская компания Deepseek произвела фурор в мире искусственного интеллекта, представив новые модели Deepseek-V3 (универсальная большая языковая модель) 24 декабря 2024 года и Deepseek-R1 (модель для решения сложных логических задач) 20 января 2025 года. Обе модели сопровождаются открытыми исходными кодами и методами обучения, что позволяет другим исследователям и разработчикам изучать и совершенствовать их, сообщает The Daily Cardinal.

Особенностью новых моделей Deepseek является их эффективность. Они показывают сравнимую с OpenAI (разработчик ChatGPT) точность при значительно меньших затратах на обучение. Кангвук Ли, профессор электротехники и вычислительной техники Университета Висконсина-Мэдисон, поясняет, что Deepseek-R1 по своим возможностям сопоставима с новейшей моделью OpenAI o1, но при этом требует гораздо меньше вычислительных ресурсов.

Ключевые инновации Deepseek:

•  Sparse Mixture-of-Experts (MoE): В отличие от традиционного «плотного» подхода, когда для обработки каждого токена (наименьшей единицы данных в ИИ) используются все параметры модели, Deepseek использует «разреженный» подход MoE. Это означает, что разные части модели («эксперты») обрабатывают разные токены. Это позволяет значительно снизить вычислительную нагрузку.

•  Multi-head Latent Attention (MLA): Технология сжатия больших объемов данных в меньшие, более управляемые размеры, что экономит память и ускоряет обработку.

•  Multi-Token Prediction: Обучение модели предсказывать несколько токенов одновременно, а не по одному, что повышает скорость обучения и генерации текста.

•  Floating-Point 8 (FP8) Mixed Precision Training: Использование меньшего диапазона данных (8 бит вместо 16 или 32) в тех случаях, когда это не влияет на конечную точность, что снижает затраты на обработку данных.

•  Long Chain-of-Thought: Использование многоступенчатых логических цепочек для ответа на запросы пользователей, что повышает точность и логичность ответов.

Почему это важно?

Эффективность моделей Deepseek имеет несколько важных последствий:

•  Снижение входного барьера: Разработка мощных ИИ-моделей становится более доступной, поскольку требует меньше вычислительных ресурсов и, соответственно, меньше затрат.

•  Конкуренция: Deepseek становится серьезным конкурентом для OpenAI и других лидеров рынка ИИ, стимулируя инновации и снижение цен.

•  Глобальное развитие ИИ: Открытый исходный код моделей Deepseek способствует развитию ИИ во всем мире, позволяя исследователям и разработчикам из разных стран использовать и совершенствовать их.

•  Ограничения на экспорт GPU: Компания Deepseek смогла эффективно обойти введенные США ограничения на экспорт современных графических процессоров, используя другие алгоритмы обработки данных.

Успех Deepseek стимулирует дальнейшие исследования в области повышения эффективности обучения нейросетей. Ожидается, что другие компании и исследовательские группы представят новые модели и методы, направленные на снижение затрат и повышение производительности ИИ. Это может привести к еще большему распространению ИИ-технологий и их внедрению в различные сферы жизни.

Термины:

•  Большая языковая модель (LLM): Нейросеть, обученная на огромном количестве текстовых данных и способная генерировать текст, переводить языки, отвечать на вопросы и выполнять другие задачи.

•  Токен: Наименьшая единица данных, обрабатываемая ИИ-моделью (обычно слово или его часть).

•  Параметры: Настраиваемые переменные в нейронной сети, которые определяют, как она обрабатывает данные.

•  Sparse Mixture-of-Experts (MoE): Архитектура нейронной сети, в которой разные части модели («эксперты») обрабатывают разные части входных данных.

•  Floating-Point 8 (FP8): Формат представления чисел с плавающей запятой, использующий 8 бит для хранения данных.

•  Графический процессор (GPU): Специализированный процессор, предназначенный для обработки графики и параллельных вычислений, широко используемый в обучении нейронных сетей.

Подписаться на нас

Сегодня, 22:00

Мусаев о матче с «Ростовом»: Это было южное дерби — каждый хотел выиграть

Встреча завершилась со счётом 0:0

Мурад Мусаев / fckrasnodar.ru

Главный тренер футбольного клуба «Краснодар» Мурад Мусаев прокомментировал сложный выездной матч против «Ростова», который завершился нулевой ничьёй.

Встреча состоялась в Ростове-на-Дону в субботу, 27 сентября, и, по словам Мусаева, его команде было непросто противостоять сопернику, так как стиль «Ростова» подходит далеко не всем. Наставник «быков» заявил, что у него нет претензий к игрокам по поводу самоотдачи.

«Это было южное дерби — каждый хотел выиграть. Ехали за победой, но ничья — закономерный результат», — сказал Мурад Мусаев в беседе с «Матч ТВ».

После десяти туров РПЛ «Краснодар» набрал 20 очков и занимает вторую строчку в таблице.

Сегодня, 21:47

Встреча «Краснодара» и «Ростова» завершилась со счётом 0:0

В следующем туре «Краснодар» 4 октября примет грозненский «Ахмат»

Фото: krd.ru

Футбольный клуб «Краснодар» не смог одержать победу в домашнем матче против «Ростова», завершив встречу десятого тура Российской премьер-лиги (РПЛ) со счетом 0:0.

Действующий чемпион РПЛ, «Краснодар», набрал 20 очков и занимает вторую позицию в турнирной таблице. У московского «Локомотива» аналогичное количество баллов, однако он опережает «Краснодар» по дополнительным показателям.

Команда «Ростов» с 10 очками находится на 11-м месте в таблице.

В следующем туре «Краснодар» встретится с грозненским «Ахматом» 4 октября, а «Ростов» в гостях сыграет с «Оренбургом» на день позже.

Сегодня, 21:11

Выбиты окна, повреждены автомобили: ВСУ нанесли ракетный удар по Белгороду

По предварительным данным, никто не пострадал

Фото: тг-канал «Настоящий Гладков»

Киевский режим нанёс ракетный удар по Белгороду. По предварительным данным, жертв нет.

«В многоквартирном доме выбиты окна на двух этажах», — написал губернатор Белгородской области Вячеслав Гладков в своём телеграм-канале.

Также, по его словам, осколки снарядов повредили десять автомобилей и остекление в коммерческом объекте.  

Информация о последствиях инцидента в настоящее время уточняется.

Сегодня, 20:28

Евгений Наумов посетил молодёжный фестиваль «45-я параллель» в Краснодаре

Любители активного отдыха могли поиграть в лазертаг и сдать пробный комплекс ГТО

Фото: Андрей Зубов

Глава Краснодара Евгений Наумов принял участие в молодёжном спортивно-творческом фестивале «45-я параллель», который прошёл во Дворце спорта «Олимп» и на прилегающей территории. Наумов осмотрел разнообразные тематические локации и пообщался с участниками проекта «Школы с мэром», которые организовали площадку «Краснодар — город добрых сердец».

«Дети, подростки, молодёжь — вы — наше будущее. А волонтёрство — это культура будущего. Вы сильные, смелые, целеустремлённые. Со временем вы придёте нам на смену, именно вам предстоит дальше строить и развивать наш город», — отметил Наумов.

Фестиваль включал 10 локаций, посвящённых спорту, экстриму, искусству и волонтёрству. Площадка «Краснодар — город добрых сердец» объединила представителей различных добровольческих организаций. Волонтёры-медики, активисты штаба #МыВместе и студенческих отрядов рассказали о своей деятельности и планах, включая изучение языка жестов для инклюзивного волонтёрства.

На других площадках фестиваля прошли граффити-джем, мастер-классы по брейк-дансу и созданию аксессуаров, а также выставки макетов современного оружия и произведений краснодарских художников. Наумов осмотрел эти локации и оставил свою подпись на баннере «Почему я люблю Краснодар», пожелав городу процветания.

Любители активного отдыха могли поучаствовать в лазертаге, попробовать свои силы в комплексе ГТО и ознакомиться с историей российского оружия. Также проводились соревнования по компьютерному спорту и мастер-классы по оказанию первой медицинской помощи. Внутри «Олимпа» желающие общались с профессионалами фитнес-индустрии и участвовали в интерактивных играх. Завершился фестиваль розыгрышем призов и выступлениями музыкальных групп.

Сегодня, 20:11

«Краснодар» — «Ростов»: после первого тайма счёт не открыт

Встреча проходит в Ростове‑на‑Дону

Фото: krd.ru

Игроки футбольных клубов «Краснодар» и «Ростов» не сумели открыть счёт в первом тайме матча 10-го тура РПЛ. Команды ушли на перерыв с цифрами 0:0 на табло.

Встреча проходит на стадионе «Ростов Арена» в Ростове-на-Дону.

В прошлом туре «Краснодар» уступил «Зениту» со счётом 0:2. ФК «Ростов» сыграл вничью с «Балтикой», счёт на табло так и не был открыт.

Ранее «Югополис» писал, что экс-футболист Масалитин предсказал «Краснодару» победу над «Ростовом».

Пользуясь нашим сайтом, вы соглашаетесь с политикой обработки персональных данных использованием файлов cookie.