Ques/Help/Req Проблемы современных конструкторов чат-ботов

XakeR

Member
Регистрация
13.05.2006
Сообщения
1 912
Реакции
0
Баллы
16
Местоположение
Ukraine
Конструкторы стали популярными инструментами для создания чат-ботов. Но работа с ними зачастую полна проблем. В этой статье мы рассмотрим некоторые из них.

Проблема 1: необходимость программировать​


Многие инструменты требуют от пользователей знаний если не программирования, то хотя бы его логики. Условно говоря, вам необходимо понимать, что определение намерений требует небольшой длины тренировочной фразы, и сразу подбирать данные таким образом, чтобы качество обучения было лучше.

Это ограничивает возможности широкого круга пользователей. Из-за этого, в моей практике, разработчики ботов гораздо реже используют надстройки над Telegram API, c функциями, методами и классами — те же aiogram и telebot, чем тот Dialogflow – no-code редактору потоков. А компаниям приходится нанимать технических специалистов — иначе остаётся «костылять» и, например, экспортировать логи вручную, в дальнейшем перегоняя их в нужный табличный вид.

В будущем авторы бота могут это исправить, расширив функционал, например, интегрировав внешний сервис, будь то Google Sheets или RetailCRM.

Data Scientist Открытие, Москва, можно удалённо, По итогам собеседования tproger.ru Вакансии на tproger.ru

Если вы исчерпали возможности текущего конструктора чат-ботов и пришли к решению осваивать программирование, прочитайте роадмап питониста.

Проблема 2: ограниченные возможности интеграции​


В настоящее время многие компании используют CRM-системы, платёжные шлюзы, системы управления инвентаризацией для управления бизнесом. Однако часто связку с ними приходится писать вручную, особенно для специализированных инструментов (таскера Atlassian Jira, коннектора для BI-инструмента Tableau и так далее), мигрировать с которых сейчас невозможно. Мне встречался случай, когда коллегам приходилось писать целый API для связи с базой данных.

Такие ограничения делают технологию менее эффективной и продуктивной. Высоконагруженный отдел разработки может ждать месяцами, прежде чем такой тикет «возьмут в оборот». Проблема стабильно повторяется с любым «подкапотным» языком конструктора чат-ботов, будь то Python или JavaScript.

Проблема 3: низкая точность распознавания речи​


Возможно, вы уже сталкивались с ситуацией, когда чат-бот не понимает, что вы ему говорите — или понимает неправильно. Это может происходить из-за шума вокруг, акцента, использования неформальных выражений или неправильного произношения слов.

Проблему решают различные алгоритмы машинного обучения, тот же многослойный перцептрон в исполнении scikit-learn. Deep learning, позволяет боту обучаться на основе взаимодействия с пользователями и понимать выражения, вплоть до 255 символов, а не только простые сочетания в три-пять слов. Благодаря этому, в том же Aimylogic логи диалогов автоматически размечаются. И вам остаётся только подтвердить добавление новой фразы в то или иное намерение.

Проблема 4: обучение​


Обучение требует большого объёма данных, которые часто бывают дефицитом на старте, и сложных алгоритмов. Из-за этого приходится покупать базы данных, пока разработчики медленно собирают свои датасеты «на малых частотах». И проект кратно удорожается.

Проблема 5: безопасность​


Создание чат-бота может быть связано с проблемами безопасности: хранением личных данных пользователей, защитой от взлома и так далее. В немногих решениях есть инструменты Cyber Security, которые обеспечивают качественную защиту от взлома аккаунта, остальные же могут быть опасны?

Гарантия сокрытия личных данных сегодня является горячей темой даже для ботов-монстров вроде ChatGPT. Полагаю, эту задачу решат в ближайшие пять лет.


Где вы береты тренировочные данные для чат-бота

  • Публичные датасеты
  • Логи чатов
  • Веб-скрейпинг
  • Синтезированные данные
  • Data Augmentation — перевод с одного языка на другой и обратно
  • Покупные данные

Написать свой вариант
 
198 114Темы
635 085Сообщения
3 618 401Пользователи
EeOneНовый пользователь
Верх