Крупные компании строятся на данных. Это невидимая сила, которая стимулирует инновации, формирует процесс принятия решений и дает компаниям конкурентное преимущество. Данные — это ключ к пониманию всех аспектов бизнеса, от понимания потребностей клиентов до оптимизации операций.
За последние несколько десятилетий рабочее место претерпело цифровую трансформацию: теперь интеллектуальная работа в основном выполняется в битах и байтах, а не на бумаге. Проекты продуктов, стратегические документы и финансовый анализ хранятся в цифровых файлах, распределенных по многочисленным репозиториям и корпоративным системам. Этот сдвиг позволил компаниям получить доступ к огромным объемам информации для ускорения своей деятельности и улучшения положения на рынке.
Однако с этой революцией, основанной на данных, возникает скрытая проблема, которую многие организации только начинают понимать. По мере того, как мы углубляемся в корпоративные данные, компании обнаруживают явление, которое настолько же распространено, насколько и неправильно понимается: темные данные.
Gartner определяет «скрытые данные» как все информационные активы, которые компании собирают, обрабатывают и хранят в рамках своей обычной деловой деятельности, но обычно не используют для других целей.
Директор по продуктам и развитию Cyberhaven.
Что делает темные данные такими коварными?
Темные данные часто содержат наиболее конфиденциальную интеллектуальную собственность и информацию организации, что делает их миной замедленного действия для потенциальных нарушений безопасности и нормативных требований. В отличие от активно управляемых данных, темные данные скрываются на заднем плане, незащищенные и часто забытые, но все же доступные для тех, кто знает, где искать.
Масштаб этой проблемы вызывает тревогу: по данным Gartner, до 80% корпоративных данных являются «темными», представляя собой огромный резервуар неиспользованного потенциала и скрытых рисков.
В качестве примера рассмотрим информацию из ежегодных отзывов сотрудников. В то время как официальные данные хранятся в программном обеспечении для управления персоналом, другая конфиденциальная информация хранится в различных формах и в различных системах: неофициальные электронные таблицы, ветки электронной почты, заметки совещаний, проекты обзоров, самооценки и отзывы коллег. Эти разрозненные, часто забытые данные рисуют ясную картину сложной и потенциально опасной природы скрытых данных в организациях.
Одно-единственное нарушение, раскрывающее эту информацию, может привести к юридическим последствиям и штрафам за неправомерное использование личной информации, потере доверия среди сотрудников, потенциальным судебным искам, конкурентным невыгодам при раскрытии стратегических планов или информации о заработной плате, а также репутационному ущербу, влияющему на набор и удержание сотрудников.
Непредвиденные последствия ИИ
ИИ меняет подход компаний к работе с «темными» данными, создавая как возможности, так и значительные риски. Большие языковые модели теперь способны выполнять поиск в огромных объемах неструктурированных данных и преобразовывать ранее недоступную информацию в ценную информацию.
Эти системы могут анализировать все: от сообщений электронной почты и протоколов встреч до сообщений в социальных сетях и журналов обслуживания клиентов. Они могут выявить закономерности, тенденции и корреляции, которые могут упустить аналитики, что потенциально приведет к более эффективному принятию решений, повышению операционной эффективности и разработке инновационных продуктов.
Однако этот новый способ доступа к данным также подвергает компании повышенному риску безопасности и конфиденциальности. Раскапывая конфиденциальную информацию из забытых уголков цифровой экосистемы, ИИ создает новые векторы утечки данных и нарушений нормативных требований. Что еще хуже, эти данные, которые индексируются решениями искусственного интеллекта, часто скрываются за разрешительным внутренним контролем доступа. Решения искусственного интеллекта делают эти данные общедоступными. По мере того, как эти системы становятся более способными объединять воедино разрозненные фрагменты информации, они могут раскрывать идеи, которые никогда не предназначались для обнаружения или распространения. Это может привести к утечке данных и возможному неправомерному использованию персональных данных.
Как бороться с этой растущей проблемой
Ключом является понимание контекста ваших данных: откуда они взялись, кто с ними взаимодействовал и как они использовались.
Например, кажущаяся безобидной электронная таблица становится гораздо более важной, когда мы знаем, что она была создана финансовым директором, предоставлена совету директоров и к ней часто обращаются до публикации квартального отчета о прибылях и убытках. Этот контекст сразу повышает важность и потенциальную чувствительность документа.
Путь к такому контекстуальному пониманию лежит через происхождение данных. Происхождение данных отслеживает весь жизненный цикл данных, включая их происхождение, перемещение и трансформацию. Он обеспечивает комплексное представление о том, как данные проходят через организацию, кто с ними взаимодействует и как они используются.
Внедряя надежные методы управления происхождением данных, организации могут понять, где хранятся их наиболее конфиденциальные данные, а также как к ним осуществляется доступ и совместное использование. Комбинируя проверку контента на основе искусственного интеллекта с контекстом о том, как к ним осуществляется доступ и совместное использование (т. е. происхождение данных), компании могут быстро выявлять темные данные и предотвращать их утечку.
Мы составили список лучших программ для управления документами.
Эта статья была создана в рамках канала Expert Insights от TechRadarPro, где мы рассказываем о лучших и ярких умах в области технологий сегодня. Мнения, выраженные здесь, принадлежат автору и не обязательно принадлежат TechRadarPro или Future plc. Если вы заинтересованы в участии, узнайте больше здесь: