Генеративный искусственный интеллект обладает огромным потенциалом революционизировать бизнес, создать новые возможности и повысить эффективность работы сотрудников. По данным McKinsey, более четверти бизнес-лидеров считают, что генеративный ИИ является вопросом повестки дня на уровне совета директоров, а 79 процентов респондентов уже использовали генеративный ИИ.
Эти технологии уже влияют на индустрию программного обеспечения. IDC обнаружила, что 40 процентов ИТ-менеджеров считают, что генеративный ИИ «позволит нам создавать гораздо более инновационное программное обеспечение», в то время как, по оценкам GBK Collective, 78 процентов компаний планируют использовать ИИ для разработки программного обеспечения в течение следующих трех-пяти лет. По данным исследования Game Developer Conference, около половины компаний, занимающихся видеоиграми, уже используют генеративный искусственный интеллект в своих рабочих процессах.
Все эти сигналы показывают, что генеративный ИИ используется все больше и больше. Однако число разработчиков, обладающих необходимыми навыками для начала создания генеративных приложений на базе искусственного интеллекта, ограничено. Для компаний, желающих создавать и эксплуатировать свои собственные генеративные сервисы на базе искусственного интеллекта, а не использовать услуги поставщика, интеграция будет иметь ключевое значение для более эффективного использования бизнес-данных. Картер Рабаса
Навигация по социальным ссылкам
Руководитель отдела по связям с разработчиками DataStax.
Где дыры?
Итак, каковы проблемы, связанные с генеративным ИИ? Первый из них — о том, как подготовить данные для генеративных систем искусственного интеллекта. Во-вторых, как эти системы можно интегрировать друг с другом и как можно разрабатывать программное обеспечение на основе возможностей генеративного искусственного интеллекта.
Для многих компаний генеративный ИИ неразрывно связан с большими языковыми моделями (LLM) и такими сервисами, как ChatGPT. Эти инструменты принимают вводимый текст, преобразуют его в семантический запрос, понятный службе, а затем предоставляют ответы на основе своих обучающих данных. Для простых вопросов может быть достаточно ответа ChatGPT. Но для компаний такого уровня общих знаний недостаточно.
Для решения этой проблемы необходимы такие методы, как поисковая дополненная генерация (RAG). RAG описывает, как компании могут собирать свои данные, предоставлять их для запросов, а затем предоставлять эту информацию LLM для записи. Эти данные могут существовать в различных форматах: от корпоративных баз знаний или каталогов продукции до текста в PDF-файлах или других документах. Данные должны быть собраны и преобразованы в векторы, которые кодифицируют данные в числовые значения, сохраняющие семантическую информацию и связи.
Этот процесс включает в себя процесс, называемый фрагментированием: разбиение текста на отдельные блоки, которые затем могут быть представлены векторами. Здесь есть несколько подходов: от рассмотрения отдельных слов до предложений или абзацев. Чем меньший объем данных вы используете, тем больше емкости и затрат он требует; И наоборот, чем больше каждый срез, тем менее точные данные вы получите. Сегментация данных по-прежнему является новой областью, и здесь все еще разрабатываются лучшие практики, поэтому вам, возможно, придется поэкспериментировать со своим подходом, чтобы получить наилучшие результаты.
После того как ваши данные были нарезаны и преобразованы в векторы, вам необходимо сделать их доступными как часть вашей генеративной системы искусственного интеллекта. Когда поступает пользовательский запрос, он преобразуется в вектор, который затем можно использовать для запроса ваших данных. Сравнивая запрос вашего пользователя с векторными данными вашей компании, вы можете найти лучшие семантические совпадения. Этими соглашениями можно затем поделиться с вашим LLM и использовать их для предоставления контекста, когда LLM создает ответ пользователю.
Данные RAG имеют два основных преимущества: во-первых, они позволяют вам предоставлять информацию вашей службе LLM для обработки, но без добавления этих данных в LLM, чтобы их можно было использовать в другом ответе. Это означает, что вы можете использовать генеративный искусственный интеллект с конфиденциальными данными, поскольку с помощью RAG вы сохраняете контроль над тем, как используются эти данные. Во-вторых, вы также можете включать в свои ответы более срочные данные: вы можете продолжать обновлять данные в своей векторной базе данных, чтобы поддерживать их как можно более актуальными, а затем делиться ими с клиентами, когда поступает правильный запрос.
Внедрение RAG является потенциальной проблемой, поскольку оно опирается на множество систем, которые в настоящее время очень новые и быстро развиваются. Число разработчиков, знакомых со всеми задействованными технологиями (группированием данных, векторным внедрением, LLM и т. д.), по-прежнему относительно невелико, и эти навыки пользуются большим спросом. Таким образом, все выиграют, если большему количеству разработчиков станет легче начать работу с RAG и генеративным искусственным интеллектом.
Здесь могут возникнуть проблемы для разработчиков. Генеративный ИИ больше всего ассоциируется с Python — языком программного обеспечения, который специалисты по данным используют для построения конвейеров данных. Однако согласно исследованию Stack Overflow за 2023 год Python занимает лишь третье место в списке самых популярных языков. Расширение поддержки других языков, таких как JavaScript (самый популярный язык программирования), может помочь большему количеству разработчиков участвовать в создании генеративных приложений искусственного интеллекта или их интеграции.. с другими системами. Абстрагирование ИИ с помощью API
Одним из подходов, который может упростить этот процесс, является поддержка API, с которыми хотят работать разработчики. Изучив наиболее распространенные языки и предоставив для них API, разработчики смогут быстрее и эффективнее приступить к работе с генеративным ИИ.
Это также помогает решить еще одну более серьезную проблему для разработчиков, связанных с генеративным ИИ: как заставить все части эффективно работать вместе. Приложения генеративного ИИ будут охватывать широкий спектр вариантов использования: от расширения существующих ботов обслуживания клиентов или функций поиска до более автономных агентов, которые смогут взять на себя все рабочие процессы или запросы клиентов. Каждый из этих шагов требует совместной работы нескольких компонентов для выполнения запроса.
Эта работа по интеграции повлечет за собой значительные накладные расходы, если мы не сможем устранить ее с помощью API. Каждое соединение между компонентами системы должно управляться, обновляться и изменяться по мере необходимости увеличения функциональности или добавления новых элементов в приложение ИИ. Вместо этого использование стандартизированных API со временем облегчит управление работой разработчиков. Это также откроет генеративный ИИ для большего числа разработчиков, поскольку они смогут работать с компонентами через API как с сервисами, вместо того, чтобы создавать и запускать свои собственные экземпляры для векторных данных, интеграции данных или фрагментирования. Разработчики также могут выбрать LLM, с которым они хотят работать, и переключиться, если найдут лучшую альтернативу, вместо того, чтобы быть привязанными к конкретному LLM.
Это также упрощает интеграцию генеративных систем искусственного интеллекта в среды разработки интерфейсов, такие как React и Vercel. Разрешение разработчикам внедрять генеративный искусственный интеллект в свои приложения и веб-сайты позволяет сочетать дизайн и доставку внешнего интерфейса с внутренней инфраструктурой. Поэтому упрощение стека будет иметь важное значение для того, чтобы к нему присоединилось больше разработчиков. Упрощение работы с полным стеком технологий Retrival Augmented Generation (или RAGStack) будет необходимо по мере того, как компании внедряют генеративный ИИ в свой бизнес. Мы выделили лучшего писателя по искусственному интеллекту.
Эта статья была подготовлена в рамках канала Expert Insights от Ny BreakingPro, где мы рассказываем о лучших и ярких умах современной технологической индустрии. Мнения, выраженные здесь, принадлежат автору и не обязательно совпадают с мнением Ny BreakingPro или Future plc. Если вы заинтересованы в участии, вы можете прочитать больше здесь: https://www.techradar.com/news/submit-your-story-to-techradar-pro.
Статья добавлена ботом, с использованием машинного перевода : https://nybreaking.com/category/tech/