Новости ИИ: технологии, продукты, исследования
Здесь вы увидите самые свежие и интересные новости об искусственном интеллекте (ИИ)!
-
Создание AI-агента для биоинформатики с использованием Biopython для анализа ДНК и белков
Создание ИИ-агента в био-информатике с использованием Biopython для анализа ДНК и белков В современном мире био-информатики, где объем данных растет с каждым днем, использование искусственного интеллекта становится неотъемлемой частью анализа. В данной статье мы рассмотрим, как создать ИИ-агента, который поможет в анализе ДНК и белков с использованием библиотеки Biopython. Этот инструмент не только упрощает процесс…
-
REFRAG: Ускорение обработки длинных контекстов в LLM на 31×
Meta Superintelligence Labs представляет REFRAG: Увеличение длины контекста в 16 раз и ускорение декодирования в 31 раз В мире искусственного интеллекта и обработки естественного языка (NLP) долгосрочные контексты остаются одной из самых сложных задач. Meta Superintelligence Labs выпустила революционное решение — REFRAG, которое не только увеличивает длину контекста в 16 раз, но и ускоряет декодирование…
-
TildeOpen LLM: Открытая языковая модель для европейских языков
Tilde AI представляет TildeOpen LLM: Открытая языковая модель с поддержкой большинства европейских языков Латвийская компания Tilde, известная своими инновациями в области языковых технологий, представила TildeOpen LLM — открытое решение, которое может изменить подход к обработке языков в Европе. Эта языковая модель с более чем 30 миллиардами параметров фокусируется на недостаточно представленном языковом пространстве, делая акцент…
-
Проблема галлюцинаций в языковых моделях: причины и решения
От предобучения к постобучению: почему языковые модели «галлюцинируют» и как методы оценки усугубляют проблему В мире искусственного интеллекта языковые модели становятся все более популярными. Однако их использование не обходится без проблем, особенно когда речь идет о «галлюцинациях» — ошибочных выводах, которые могут ввести в заблуждение пользователей. В этой статье мы рассмотрим, почему это происходит и…
-
Оптимизация обучения трансформеров с DeepSpeed: передовые техники и масштабирование
Внедрение DeepSpeed для масштабируемых трансформеров: продвинутое обучение с градиентным контрольным пунктом и параллелизмом В последние годы искусственный интеллект стал неотъемлемой частью бизнес-процессов, и обучение крупных языковых моделей требует все больше вычислительных ресурсов. В этом контексте инструмент DeepSpeed предлагает мощные решения для оптимизации обучения, позволяя значительно сократить время и затраты на ресурсы. Что такое DeepSpeed? DeepSpeed…
-
ARGUS: Масштабируемая AI-структура для обучения крупных рекомендательных трансформеров
Встречайте ARGUS: Масштабируемая ИИ-платформа для обучения больших рекомендательных трансформеров до одного миллиарда параметров Yandex представил ARGUS (AutoRegressive Generative User Sequential modeling) — масштабируемую платформу на основе трансформеров для рекомендательных систем, способную работать с одним миллиардом параметров. Этот прорыв ставит Yandex в ряд мировых технологических лидеров, таких как Google, Netflix и Meta, которые успешно преодолели давние…