LLM используются для понимания запроса, а результаты поступают непосредственно из Data Commons, включая ссылку на исходный источник данных; таким образом, LLM не генерирует выходные данные. Этот подход позволяет Data Commons избежать некоторых известных в настоящее время ограничений LLM в отношении фактичности в определенных случаях.
Data Commons не собирает и не владеет какими-либо данными, но использует общедоступные данные из более чем 200 источников, охватывающих тысячи наборов данных, включая демографию, экономику, образование, жилье, общественное здравоохранение, климат, устойчивое развитие и биомедицину. Есть данные из 194 страныв некоторых странах до Состояние Или округ уровень. Однако доступные на данный момент данные не распределены равномерно и не являются полными. К сожалению, доступность данных отражает многие из тех же проблем равенства, с которыми мир сталкивается в других вопросах. Таким образом, в настоящее время у нас больше данных по США, Индии и странам ОЭСР, чем по странам ОЭСР. странах Африки, Южной Америки и некоторых частях Азии. Требуется дополнительная и постоянная работа для предоставления дополнительных, актуальных данных. Мы надеемся, что будет опубликовано больше общедоступных данных, которые помогут заполнить пробелы, и постараемся добавить больше полезных категорий данных, чтобы лучше понять мир и дать возможность тем, кто работает, решать насущные социальные проблемы. Мы активно ищем Дополнительная информация и партнеров, чтобы помочь заполнить некоторые из этих пробелов.
Data Commons — это открытый исходный код, открытый процесс и доступный для всех. Помимо сайта Data Commons, в ответах на поисковые запросы Google используется подмножество точек данных Data Commons. Мы также сотрудничаем с организациями, использующими Data Commons для решения социальных проблем. Результатом является растущая экосистема, которая позволяет таким группам, как Ресурсы для будущего, Накормите Америку, IIT Мадрас Центр Роберта Боша по науке о данных и искусственному интеллекту, Стэнфордская школа устойчивого развития ДорраИ Институт количественных социальных наук Гарвардского университета иметь свои собственные версии Data Commons, предоставляя организациям единое представление своих собственных данных со всеми общедоступными данными, уже доступными через Data Commons.
Марни Уэбб, директор по взаимодействию с обществом ТехСупдавний партнер Google, объяснил, чем Data Commons может быть полезен небольшим некоммерческим организациям, с которыми работает его организация: «Data Commons предоставляет местным организациям доступ к необходимым им данным. Это дает им инструменты, позволяющие задавать вопросы о потребностях их сообщество на том языке, который они использовали бы, чтобы задать вопрос коллеге и получить взамен достоверную информацию, как если бы в штате инженеров по обработке данных были специалисты по обработке и анализу данных.Мы говорим о демократизации информации для лучшего принятия решений, поэтому организации Мы говорим о передаче власти данных в руки тех, кто лучше знает свои сообщества.
Например, благодаря финансированию Google.оргTechSoup помогает некоммерческим организациям использовать возможности Data Commons для оценки и решения социальных проблем. Например, Cemefi выделяет пересечения между голод и пол в Мексике и Макайе следует экономический и социальный рост в Колумбии. TechSoup иллюстрирует взаимосвязь между продовольственная безопасность, сельское хозяйство и изменение климата путем сбора данных из таких источников, как Министерство сельского хозяйства США и Feeding America.