Поскольку отрасль искусственного интеллекта (ИИ) продолжает развиваться, требуется разработка надежной инфраструктуры для обучения моделей и предоставления услуг, что оказывает существенное влияние на хранение и управление данными. Это имеет значительные последствия для объема генерируемых данных и, что наиболее важно, как и где эти знания должны храниться.
Возможность эффективного управления этими данными становится критически важной, поскольку требования к данным растут экспоненциально из-за постоянного роста и развития инструментов ИИ. Поэтому инфраструктура хранения, необходимая для поддержки этих систем, должна иметь возможность масштабироваться параллельно с быстрым развитием приложений и возможностей ИИ.
Поскольку ИИ создает новые данные и делает существующие данные еще более ценными, быстро возникает цикл, в котором увеличение генерации данных приводит к увеличению потребностей в хранении. Это стимулирует дальнейшее создание данных и формирует «эффективный цикл данных ИИ», который продвигает разработку ИИ вперед. Чтобы полностью реализовать потенциал ИИ, организации должны не только понимать этот цикл, но и полностью понимать его последствия для инфраструктуры и управления ресурсами. Питер Хейлс
Навигация по социальным ссылкам
Питер Хейлс, менеджер по маркетингу продукции HDD, Western Digital. Шестифазный цикл данных ИИ
Цикл данных ИИ состоит из шестифазной структуры, разработанной для оптимизации обработки и хранения данных. Первая фаза фокусируется на сборе существующих необработанных данных и хранении. Здесь данные собираются и хранятся из разных источников, и анализ качества и разнообразия собранных данных имеет решающее значение: он закладывает основу для следующих фаз. Для этой фазы цикла рекомендуются жесткие диски бизнес-класса (eHDD), поскольку они обеспечивают самую высокую емкость на диск и самую низкую стоимость за бит.
На следующей фазе данные готовятся к приему, а оценка с предыдущей фазы администрируется, подготавливается и преобразуется для целей обучения. Для выполнения этой фазы центры обработки данных развертывают обновленную инфраструктуру хранения, такую как высокоскоростные озера данных, для поддержки данных для подготовки и приема. Здесь необходимы твердотельные накопители большой емкости для расширения существующего хранилища HDD или создания новых систем хранения all-flash. Это обеспечивает быстрый доступ к организованным и подготовленным данным.
Затем следует следующая фаза обучения моделей ИИ для создания точных прогнозов с использованием обучающих данных. Эта фаза обычно выполняется на мощных суперкомпьютерах, требующих специальных и мощных решений для хранения данных для наиболее эффективной работы. Здесь создаются флэш-память с высокой пропускной способностью и улучшенные eSSD с низкой задержкой для удовлетворения конкретных потребностей этой фазы и обеспечения необходимой скорости и точности.
Затем, после обучения, фаза вывода и подсказок фокусируется на создании удобного интерфейса для моделей ИИ. Эта фаза включает использование интерфейса прикладного программирования (API), панелей управления и инструментов, которые объединяют контекст с конкретными данными с указаниями конечного пользователя. Затем модели ИИ будут интегрированы в интернет- и клиентские приложения без необходимости обмена текущими системами. Это означает, что поддержка текущих систем вместе с новыми вычислениями ИИ потребует больше места для хранения.
Подпишитесь на рассылку новостей Ny Breaking и получайте все лучшие новости, мнения, функции и рекомендации, необходимые вашему бизнесу для успеха!
Здесь более крупные и быстрые SSD необходимы для модернизации ИИ в компьютерах, а для смартфонов и систем Интернета вещей необходимы более емкие встроенные флэш-устройства для поддержания бесперебойной работы в реальных приложениях.
Далее следует фаза движка вывода ИИ, на которой обученные модели помещаются в производственные среды для проверки новых данных, создания нового контента или составления прогнозов в реальном времени. На этом этапе уровень эффективности движка имеет решающее значение для достижения быстрых и точных ответов ИИ. Для обеспечения комплексного анализа данных необходима значительная производительность хранилища. Для поддержки этого этапа можно использовать SSD-накопители большой емкости для потоковой передачи или моделирования данных на серверах вывода на основе потребностей в масштабе или времени отклика, в то время как SSD-накопители большой емкости можно использовать для кэширования.
На последнем этапе создается новый контент, где модели ИИ производят и затем сохраняют информацию. Этот этап завершает цикл данных, постоянно улучшая ценность данных для будущего обучения и анализа модели. Сгенерированный контент хранится на корпоративных жестких дисках для архивирования в центре обработки данных, а также на SSD-накопителях большой емкости и встроенных флэш-устройствах для периферийных устройств ИИ, что делает его немедленно доступным для будущего анализа. Самоподдерживающийся цикл генерации данных
Полностью понимая шесть фаз цикла данных ИИ и развертывая правильные инструменты хранения для поддержки каждой фазы, компании могут эффективно поддерживать технологию ИИ, оптимизировать свои внутренние операции и максимизировать выгоды от своих инвестиций в ИИ.
Сегодняшние приложения ИИ используют данные для создания текста, видео, изображений и различных других форм интересного контента. Этот непрерывный цикл потребления и генерации данных ускоряет потребность в производительных и масштабируемых технологиях хранения для управления большими наборами данных ИИ и эффективной реструктуризации сложных данных, стимулируя дальнейшие инновации.
Спрос на подходящие решения для хранения данных со временем значительно возрастет, поскольку роль ИИ во всех операциях станет еще более важной и неотъемлемой. В результате доступ к данным, эффективность и точность моделей ИИ, а также более крупные, высококачественные наборы данных также будут становиться все более важными. Кроме того, поскольку ИИ становится встроенным практически в каждую отрасль, партнеры и клиенты могут ожидать, что поставщики компонентов для хранения данных адаптируют свои продукты для предоставления подходящего решения для каждого этапа цикла данных ИИ. Мы предложили лучшую услугу восстановления данных.
Эта статья была подготовлена в рамках канала Expert Insights Ny BreakingPro, где мы представляем лучшие и самые яркие умы в современной технологической отрасли. Мнения, высказанные здесь, принадлежат автору и не обязательно совпадают с мнением Ny BreakingPro или Future plc. Если вы заинтересованы в том, чтобы внести свой вклад, вы можете прочитать больше здесь: https://www.techradar.com/news/submit-your-story-to-techradar-pro
Статья добавлена ботом, с использованием машинного перевода : https://nybreaking.com/category/tech/