14 прогнозів даних щодо зростання підприємства у 2023 році

Щоб ще більше зміцнити нашу прихильність забезпеченню найкращого в галузі охоплення технологій обробки даних, VentureBeat раді вітати Ендрю Бруста як постійного учасника. Слідкуйте за його статтями в Data Pipeline.

Настав 2023 рік, і підприємства налаштовані максимально використати його. Від стартапів до великих конгломератів, кожна компанія увійшла в новий рік з тією самою місією – сприяти зростанню з акцентом на операційну ефективність, продуктивність і стійкість.

Оскільки дані відіграватимуть ключову роль у досягненні цієї місії, провідні експерти галузі та постачальники поділилися прогнозами щодо того, як буде формуватися простір даних у найближчі місяці.

1. ІТ-директори намагатимуться консолідувати дані та спростити архітектуру

«Спілкуючись з іншими ІТ-директорами, я помітив, що компанії ростуть експоненціально без плану організації своїх даних. Коли компанія розглядає можливість масштабування будь-якою ціною, але не інвестує в правильну технологію для підтримки такого зростання, виникатимуть проблеми. Частково проблема полягає в тому, що ІТ-директори сьогодні мають керувати надто великою кількістю систем. Занадто багато роз’єднаних пулів даних призводить до дублювання, ізольованих і заблокованих даних, керування та аналіз яких є не лише своєчасним і дорогим, але також призводить до проблем із безпекою. Щоб компанія справді просунулася вперед у цифровій трансформації, їй потрібно поєднати науку про дані й аналітику даних і черпати інформацію з єдиного джерела правди. Ми побачимо, що більше ІТ-директорів будуть скорочувати витрати постачальників, щоб спростити свою архітектуру даних. Компанії, які впроваджують архітектуру, яка поєднує ретроспективу та прогнозну аналітику для надання ефективних та інтелектуальних рішень, зрештою виграють».

— Навін Зутші, ІТ-директор Databricks

Подія

Intelligent Security Summit On-Demand

Дізнайтеся про важливу роль штучного інтелекту та машинного навчання в кібербезпеці та конкретних галузевих прикладах. Дивіться сеанси за запитом сьогодні.

Дивіться тут

2. Більш широке впровадження договорів даних

«Створені для запобігання проблемам з якістю даних, які виникають на початку, коли служби генерування даних несподівано змінюються, контракти на дані дуже популярні. чому Завдяки змінам, внесеним розробниками програмного забезпечення, які несвідомо створюють розгалуження за допомогою оновлень, що впливають на вихідний конвеєр даних, і розвиток моделювання даних дає розробникам даних можливість доставляти дані в сховище, попередньо змодельовані. У 2023 році ми побачимо ширше впровадження контрактів на дані, оскільки практики намагатимуться застосувати ці рамки».

— Ліор Гевіш, співзасновник і технічний директор Monte Carlo

3. Доступність стане ключем до перемоги у 2023 році

«За останні роки ми зрозуміли, що збої можуть завдати шкоди бізнесу. У 2023 році доступність стане секретом, який відрізнятиме переможців від переможених. Компанії повинні уникати замкнутості та мати гнучкість для масштабування. Диверсифікуючи хмарне середовище, компанії мінімізують вплив збоїв на свою здатність продовжувати роботу».

— Патрік Боссман, менеджер із продуктів MariaDB

4. 2023 рік стане роком програми даних

«За останні десять років ми спостерігали зростання популярності веб-додатків і додатків для телефонів, але 2023 рік став роком додатків для даних. Надійні, високопродуктивні програми обробки даних стануть важливим інструментом успіху, оскільки компанії шукають нові рішення для вдосконалення програм, орієнтованих на клієнтів, і внутрішніх бізнес-операцій. З додатками для передачі даних на вимогу, як-от Uber, Lyft і Doordash, які доступні у нас під рукою, немає нічого гіршого для клієнта, ніж застрягти з колесом приреченості й запитом не проходити. Завдяки базі аналітики в реальному часі ми побачимо посилений тиск на додатки для обробки даних, щоб вони не лише працювали в режимі реального часу, але й були безвідмовними».

— Дхруба Бортакур, співзасновник і технічний директор Rockset

5. Зростання угоди про обробку даних (DPA)

«Те, як організації обробляють дані в локальних системах, історично було дуже контрольованим процесом, який потребує важких інженерних ресурсів і ресурсів безпеки. Однак, використовуючи сучасну інфраструктуру даних SaaS, ще ніколи не було простіше ділитися даними та отримувати доступ між відділами, регіонами та компаніями. Зважаючи на це та внаслідок посилення законів про локалізацію/суверенітет даних, правила щодо того, як отримати доступ, обробляти та звітувати про використання даних, необхідно буде визначити в договірних угодах, також відомих як угоди про обробку даних ( DPA).

У 2023 році ми побачимо, що DPA стане стандартним елементом контрактів SaaS і переговорів про обмін даними. Те, як організації обробляють ці контракти, докорінно змінить те, як вони розробляють інфраструктуру даних, і визначатиме бізнес-цінність даних. Як наслідок, в інтересах лідерів обробки даних буде повне впровадження DPA у 2023 році та пізніше. Ці довгі документи будуть складними, але оцифрування DPA та залучення юридичних команд значно полегшить їх розуміння та впровадження».

— Метт Керролл, співзасновник і генеральний директор Immuta

6. Обмін даними без копіювання закріпиться

«У 2023 році, коли обмін даними продовжує зростати, а командам із обробки даних та ІТ-технологіям не вдається встигати, обмін даними без копіювання стане новим стандартом. У міру того, як організації створять свій сучасний стек даних, відбудеться вибух у розмірі та кількості наборів даних. Зробити копії перед тим, як надіслати, просто більше не можливо. У 2023 році підприємства кинуться на усталені платформи, як-от Data Exchange від Snowflake і протокол Delta Sharing від Databricks, щоб полегшити обмін даними та безпечну монетизацію».

— Метт Керролл, співзасновник і генеральний директор Immuta

7. Автоматизація на основі штучного інтелекту для управління неструктурованими даними набуде популярності

«Управління даними для файлів і об’єктів стає все більш досконалим завдяки адаптивному машинному навчанню та автоматизації на основі штучного інтелекту для інтелектуального керування розміщенням даних, керуванням життєвим циклом, пошуком і переміщенням. Рішення можуть адаптуватися на основі профілю витрат клієнта, профілю даних і цільового забезпечення та з часом навчатися для вдосконалення рекомендацій. Наприклад, алгоритм штучного інтелекту можна використовувати для проактивної ідентифікації конфіденційних наборів даних, таких як файли з розширеннями або тегами, пов’язаними з фінансовими документами, які зберігалися невідповідно, наприклад у каталозі CMO, а не в каталозі, який належить лише для читання. фінансовим директором».

— Кумар Госвамі, генеральний директор і співзасновник Komprise

8. Синтетичні дані прискорять інновації ШІ

«У 2023 році синтетичні дані змінять правила гри в прискоренні розробки та розгортання штучного інтелекту, одночасно захищаючи від упередженості алгоритмів. Однією з важливих проблем у розробці штучного інтелекту є отримання необхідної кількості та різноманітності даних для навчання алгоритмів на основі машинного навчання. Ці алгоритми вимагають величезних обсягів даних, які репрезентують різних людей, які взаємодіятимуть з ними, і контексти, в яких вони використовуватимуться. Важко, довго та дорого отримати таку ширину та глибину даних. Синтез даних дозволяє компаніям зі штучним інтелектом швидко розширювати наявні набори даних і симулювати сценарії, які важко створити в реальному світі.

Наприклад, в автомобільній промисловості інструменти синтетичних даних можуть використовувати вихідне зображення водія для створення синтетичних варіантів, які використовують різні умови освітлення або рухи голови. Це може навіть імітувати водія, який засинає за кермом – дані, які рідко і дуже небезпечні для отримання в реальному житті. Розгортання інструментів синтетичних даних має ключове значення не тільки для вирішення цих складних проблем зі збором даних, але й для боротьби з упередженістю алгоритмів, забезпечуючи справді різноманітні набори даних».

— Доктор Рана ель Каліубі, заступник генерального директора Smart Eye

9. У багатохмарному світі сховище об’єктів є основним

«Наразі бази даних об’єднуються в сховище об’єктів як основне рішення для зберігання. Це обумовлено продуктивністю, масштабованістю та відкритими форматами таблиць. Однією з ключових переваг у поширенні форматів відкритих таблиць (Iceberg, Hudi, Delta) є те, що вони дозволяють співіснувати багатьом базам даних і аналітичним механізмам. Це, у свою чергу, створює вимогу працювати де завгодно – те, для чого добре підходить сучасне сховище об’єктів.

Перші докази є вагомими: і Snowflake, і Microsoft наприкінці 2023 року розроблять функціональність зовнішніх таблиць. Тепер компанії зможуть використовувати сховище об’єктів для будь-якої бази даних без необхідності переміщувати ці об’єкти безпосередньо в базу даних, вони можуть робити запити на місці».

— Ананд Бабу Періасамі, співзасновник і генеральний директор MinIO

10. Накопичення даних буде в центрі уваги

«Накопичення даних є однією з найбільших прихованих таємниць сучасної галузі. Маючи 14,4 мільярда точок підключення у 2022 році, компанії сидять на скарбницях даних, які не мають жодного реального використання. Вважається, що вони зможуть використовувати свої дані в майбутньому так, як вони не мають доступу сьогодні, але це зовсім навпаки.

Кожен фрагмент даних також стає більшим у міру розвитку технологій. Усе стає багатшим, від камер із високою роздільною здатністю до якісніших мікрофонів – усе це займає величезну кількість місця.

Я очікую, що компанії та споживачі почнуть звертати увагу на дані, які вони починають несвідомо накопичувати».

— Ренен Халлак, засновник і генеральний директор VAST Data

11. Зростання гібридних хмарних розгортань BYODB

«Переваги переміщення певних проектів, керованих даними, у хмару беззаперечні — швидше розгортання, зниження витрат на інфраструктуру та технічне обслуговування, вбудована підтримка та SLA, а також миттєва масштабованість, коли вам це потрібно. Однак завжди існуватимуть зобов’язання щодо сценарію використання, які вимагатимуть зберігання даних на місці, включаючи продуктивність, безпеку, відповідність нормативним вимогам, локальну розробку та апаратне забезпечення з повітряним розривом (це декілька). Гнучкішим рішенням для сучасних постачальників даних є підтримка гібридного хмарного розгортання «принесіть свою власну базу даних» (BYODB) на додаток до більш поширених варіантів локальних і повністю керованих хмарних служб.

Цей новий підхід набуде поширення в найближчі роки, дозволяючи зберігати дані на місці й незмінними, але віддалено підключатися до сервісів SaaS, які надходять із найближчих центрів обробки даних. Це забезпечує всі переваги хмари, водночас дозволяючи повні повноваження та контроль над найціннішим ресурсом компанії… її даними».

— Бен Хейнс, генеральний директор і співзасновник Directus

12. Трубопроводи стануть складнішими

«Конвеєр даних — це те, як дані потрапляють із свого початкового джерела в сховище даних. З такою кількістю нових типів даних і безперервним надходженням даних ці конвеєри стають не тільки більш важливими, але й потенційно складнішими. У 2023 році користувачі повинні очікувати, що постачальники сховищ даних запропонують нові та кращі способи вилучення, трансформації, завантаження, моделювання, тестування та розгортання даних. І постачальники зроблять це, зосередившись на інтеграції та простоті використання.

— Кріс Гладуін, генеральний директор і співзасновник Ocient

13. Векторні бази даних закріплюються, щоб розкрити цінність невикористаних неструктурованих даних

«У міру того, як компанії вступають в епоху штучного інтелекту та намагаються повною мірою використовувати його переваги у виробництві, відбувається значне зростання обсягу неструктурованих даних, які приймають усілякі форми, які потребують розуміння. Щоб впоратися з цими проблемами у вилученні відчутної цінності з неструктурованих даних, векторні бази даних – новий тип технології керування базами даних, спеціально створений для обробки неструктурованих даних – набирає обертів і закріпиться в найближчі роки».

— Френк Лю, операційний директор Zilliz

14. Спостереженість даних стане критично важливою галуззю

«У сучасній економіці надзвичайно важливо постійно розраховувати рентабельність інвестицій і визначати пріоритети способів, як ми можемо зробити більше з меншими витратами. Я вважаю, що інженерні команди мають можливість працювати над збільшенням спроможності компанії перемагати. Я передбачаю, що ми все частіше побачимо, як інженери та групи обробки даних стають фасилітаторами, які дозволятимуть компаніям приймати рішення на основі даних, будуючи інфраструктуру та надаючи інструменти, необхідні для роботи з іншими командами (особливо нетехнічними командами). Один із способів, як вони забезпечать цю зміну, — це допомогти командам зрозуміти, як отримати доступ до своїх даних у корисливий спосіб, а не бути постійно в центрі відповідей на запитання. Замість того, щоб наймати більше науковців з обробки даних, я очікую, що групи обробки даних збільшать роль інженерів даних, щоб побудувати довготривалу інфраструктуру, яка дозволить людям з усіх боків бізнесу відповідати на запитання незалежно».

Шаді Ростамі, старший віце-президент з інженерії Amplitude

Місія VentureBeat має стати цифровою міською площею для тих, хто приймає технічні рішення, щоб отримати знання про трансформаційні корпоративні технології та транзакції. Відкрийте для себе наші брифінги.

Leave a Comment