На рынке ИИ побеждает не тот, у кого больше чипов, а тот, у кого лучше алгоритмы
Запущенный в конце декабря китайский ИИ-сервис DeepSeek стал самым популярным ИИ-инструментом в России, обогнав отечественный «Шедеврум» от «Яндекса». Такие данные 12 февраля обнародовали аналитики компании Yota.
— Искусственный интеллект и нейросети — это разные понятия. Чем они отличаются?
Олег Бартунов: Понятия «нейросеть» и «искусственный интеллект» взаимосвязаны и их легко спутать, но при этом имеют отличия. Нейросеть — это алгоритм, который хорошо определяет паттерны (шаблоны) в данных, за счет чего можно решать сложные задачи. Сейчас нейросети стали самым успешным подходом к построению систем искусственного интеллекта — брендом, под которым создаются последние модели.
Понятие «искусственный интеллект» более широкое и включает в себя логические модели, генетические алгоритмы, экспертные системы и не только — фактически все, что может имитировать человеческий интеллект.
— Чем китайские разработки в области искусственного интеллекта (DeepSeek) отличаются от американских (ChatGPT)? Есть ли вообще какая-то разница или они созданы на одних и тех же принципах и архитектуре?
Олег Бартунов: Из-за ограниченного доступа к мощным графическим процессорам (GPU) в Китае развивается полезное направление оптимизации архитектурных решений и алгоритмов обучения. Это дает возможность достигать высоких результатов на значительно меньших вычислительных ресурсах. Такой подход качественно продвигает индустрию по сравнению с масштабированием мощностей, которым OpenAI занималась долгое время.
Отсутствие серьезных этических ограничений на выдачу моделей тоже играет свою роль и ведет к повышению качества ответов. Выделяется и то, что в DeepSeek можно наблюдать процесс «размышления» — анализа данных и подбора ответа. При этом, как и в российских LLM, данные для обучения моделей учитывают региональные особенности. Смещение акцентов в некоторых темах и вкладывание определенной морали в ответ моделей — это один из примеров региональных особенностей LLM. Другой случай: в результатах генерации китайских моделей иногда можно встретить иероглифы даже там, где используются русский или английский языки.
— Что такое LLM?
Олег Бартунов: LLM (Large Language Model) — это большая языковая модель, особая нейросетевая архитектура, которая обучается на огромных объемах текстовых данных. В процессе обучения модель выявляет сложные закономерности человеческого языка, включая синтаксис, семантику и контекстуальные зависимости.
За счет этого LLM может самые разные задачи — генерация текста, классификация, перевод, суммаризация, в том числе преобразование естественного языка в SQL-запросы, над чем активно работает команда Postgres Pro.