Чат-боты уничтожат Google? Почему пока рано говорить о победе ИИ
Чат-боты при помощи искусственного интеллекта становятся все лучше и быстрее в поиске информации. Но поисковые системы — это нечто большее, чем просто поиск.
Чат-боты при помощи искусственного интеллекта становятся все лучше и быстрее в поиске информации. Но поисковые системы — это нечто большее, чем просто поиск.
Поисковому бизнесу придется потесниться. Такие инструменты, как ChatGPT и Copilot, продолжают улучшаться, и эксперты уже говорят о новых способах поиска и потребления информации в интернете. Даже Google — главный игрок на поисковом рынке — ускорила разработки в области ИИ и выпустила свою модель Gemini, которую пытается встроить в поиск. Кажется, что за искусственным интеллектом будущее: вместо просмотра ленты рандомных ссылок пользователь может сразу же получить прямые ответы на любые вопросы в одном месте.
Но все не так просто. Любая поисковая система — это не только алгоритмы и набор ссылок. В первую очередь это пользовательский опыт, который бывает разнообразным. Кроме поиска важной и труднодоступной фактической информации люди ищут свой почтовый язык, заходят на сайты доставки и вспоминают, в каком году родился Эйнштейн. Известный факт, что огромное количество людей заходят на страницу Google, чтобы набрать в поисковой строке «google». Пользовательские пути неисповедимы.
Если чат-боты хотят победить Google, они должны думать как Google. Вопрос не в том, насколько хорошо ИИ-инструменты могут находить информацию — намного важнее, могут ли они делать все то, что делает Google. Боты, которые работают на основе больших языковых моделей, действительно намного эффективнее ищут и структурируют информацию для пользователя, хотя до сих пор страдают от галлюцинаций. Но проигрывают в другом.
В основном существует три типа популярных запросов. Самый распространенный — это навигация, которая заключается в том, что люди вводят названия ресурсов, куда они хотят попасть. Миллиарды запросов «youtube», «mail» и «linkedin» — навигационные, поскольку основная задача поисковой системы — привести пользователя на веб-сайт. ИИ справляется с навигацией намного хуже: крайне редко пользователь получит то, что ищет, а вместо ссылка на сайт Amazon будет пространный текст с кучей квазиполезной информации.
Вторая по популярности категория запроса — информационные. Например, вам нужно узнать что-то конкретное: часы работы, погоду за окном, время в Нью-Йорке, счет вчерашнего матча. Не имеет значения, откуда пользователь получит эту информацию, ее нужно передать быстро и она должна быть максимально точной. И тут опять выигрывает Google: поисковик не только делает это правильно и быстро, но и отображает виджет с другой статистикой и данными, которые могут пригодиться. Особенно, если информация привязана к геолокации, которой боты не обладают.
Однако в более общих вопросах искусственный интеллект уже опережает, поскольку может разъяснить, как измеряется атмосферное давление и что такое високосный год. Преимущество бота заключается в структурировании информации, но не в ее качестве. Даже если ответ кажется вам правдивым, вы все равно для уверенности погуглите ответ. Полагаться на один источник опрометчиво, но пролистывать страницы ссылок ради единственного ответа утомляет. Особенно если дело доходит до гайдов и инструкций.
Третья категория — это исследовательские запросы. Это те вопросы, на которые нет однозначного ответа, и сам поиск уже выглядит процессом обучения: «что такое TikTok», «как рыбы дышат под водой», «почему Тейлор Свифт такая популярная». Именно в этой категории искусственный интеллект побеждает поисковик. Кроме поиска в таких запросах важен контекст, с которым существующие боты уже неплохо справляются. Вместо списка одинаковых ссылок генеративный поиск предлагает небольшой экскурс с возможностью углубиться в тему.
Еще одно преимущество искусственного интеллекта — это поиск цитат. ИИ-системы постепенно улучшают поиск источников — в идеале пользователь сможет по одному запросу перейти сразу же к источнику информации. Но главное препятствие в точности — это базы данных, вокруг которых происходят споры об авторском праве. Многие правообладатели закрывают доступ к своим ресурсам и подают в суд на разработчиков, те же вводят ограничения в системы — и боты уже не могут ссылаться на запрещенные источники.
Другое конкурентное направление — это подборки, в котором пока нет явного лидера. Когда мы хотим посмотреть какую-то киноновинку, мы гуглим. Для Google этот запрос — самый популярный, и компания разрабатывает специальные виджеты для удобства поиска. Боты наловчились структурировать информацию и также предлагают подборки, но их ответы могут смутить. Все-таки поисковики выигрывают в актуальности и визуальности: мы можете не только прочитать описание, но тут же посмотреть трейлер и почитать отзывы о фильме.
Чат-боты задали правильное направление развития для поиска, но столкнулись с поведением пользователей. Колоссальные возможности ИИ-систем до сих пор заключены в рамках интерфейса, который пока далек от совершенства. Любой, кто пользуется чат-ботами, наверняка заметил, какой он неудобный и довольно медленный. Пока при мысли найти ближайшую кофейню или научиться завязывать галстук каждый открывает поисковик — Google может не беспокоиться о будущем своего бизнеса.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.
"бот пытается в течение 10 секунд генерировать текст". это целая вечность 🤷, а тормозит оно из-за перебора всех значений
"Еще одно преимущество искусственного интеллекта — это поиск цитат."
Сомнительно. Чат боты никогда не будет точными. Никогда потому что это "сжатие" и вероятности. Точно индексирует и ищет поисковик
[censored - П. 4.1.2. Пользовательского соглашения — https://mstagmanager.com/pages/polzovatelskoe-soglashenie]
Пользователь отредактировал комментарий 30 марта 2024, 15:57
LLM сравнивают с JPEG, потому что в процессе обучения они, как бы, загружают в себя все знания о мире. И так как внутри не текст, а просто циферки-веса, то это действительно немного похоже на алгоритм сжатия. Было много текста, а стали цифры, которые занимают намного меньше места. Но это все-таки не сжатие - веса не отражают оригинальный текст. Во всяком случае не напрямую, как JPEG. Это больше похоже на то, как если бы взяли много картинок - и их все вместе сжали в один JPEG-файл. Большие LLM иногда могут довольно точно воссоздать оригинальный текст, но это скорее сторонний эффект их работы. Мало кто до конца понимает, как они это делают.
Но это не единственный способ, как можно получать информацию с помощью LLM. Сейчас стали популярны векторные базы, где исходный текст дробится на куски - и вот тут уже куски текста действительно сжимаются в числа (вектора) с помощью AI. LLM очень эффективно могут трансформитьвать текст в другие форматы с сохранением смысла. В данном случае в числа-вектора (это называется embedding, все LLM API предлагают такую функциональность). После можно взять текст-запрос, сжать его тем же алгоритмом и поискать похожие (математически) вектора в базе. На практике это работает так, что по тексту-запросу находятся похожие по смыслу куски текста, которые можно выгрузить в виде оригинальных документов. Эта техника довольно успешно конкурирует с full text search и индексированием.
Попробуйте ради интереса сервис perplexity.ai. Он бесплатный. Просто чтобы увидеть, каким может быть поиск с помощью AI. Он очень быстро отвечает и дает ссылки на сайты-источники. Да и в целом, LLM становятся все быстрее и быстрее. Groq Илона Маска выдает ответы на уровне GPT-3.5, но работает при этом раз в 10 быстрее.
Пользователь отредактировал комментарий 30 марта 2024, 18:12
Напомнило о биоинформатике. Интересовался алгоритмами и структурами данных там используемыми. Там используются векторные базы данных.
"Многие инвесторы следуют за толпой, не вникая в то, как работает эта антропоморфизированная технология. Чат-боты впечатляют созданием последовательного, грамматически и семантически правильного контента. Однако оказывается, что они не обязательно понимают описываемую реальность. Ответы, которые они дают, являются результатом не анализа фактов, а расчета вероятности. Большие языковые модели (LLM) работают аналогично функции прогнозирования текста в смартфонах или почтовых ящиках, говорят их критики." https://www.forbes.pl/opinie/czy-sztuczna-inteligencja-to-banka-spekulacyjna-partner-bigmont-ventures-o-tym-jak/ew4eph3