Что такое протокол EpiK?
2022年06月21日
Как одно из важных направлений исследований в области искусственного интеллекта, исследования и разработки Knowledge Graph завершили свою первую половину.
В 2012 году продукт Google Knowledge Graph приобрел первоначальную форму, открыв эру графов знаний. К настоящему времени Knowledge Graph широко используется в различных задачах обработки естественного языка, таких как поиск информации, автоматические вопросы и ответы, анализ решений и т.д. во многих областях, таких как финансы, электронная коммерция, медицина и государственные дела.
Для построения графа знаний необходимо выполнить четыре этапа: извлечение данных, объединение данных, осмысление данных и принятие решений на основе данных.
Таким образом, граф знаний формируется на основе данных. Данные - это единица, а алгоритм - ноль. Данные определяют верхний предел применения технологии графа знаний, а алгоритмы позволяют приближаться к этому пределу бесконечно.
От качества данных будет напрямую зависеть эффективность и качество построения графа знаний.
А эти данные в настоящее время обычно получают по множеству каналов. Например, открытые данные в сети получают в виде краулеров, таких как сайты СМИ, сайты национальных правительств и т.д.. Есть также данные, полученные в результате сотрудничества организаций или покупки авторских прав, например, Digital Science, Китайская инженерная академия и т.д.
Эти различные источники данных будут объединены и ассоциированы алгоритмами, что станет основой для построения графа знаний.
Возникает вопрос. Достигли ли алгоритмы того уровня развития, когда они могут полностью понять логику данных, знания или здравый смысл в определенной области промышленности, организованные в структурированную форму, и затем рассуждать и принимать решения на их основе? К сожалению, подобно тому, как опыт и познание каждого человека имеют "стену", автоматизированный сбор информации из разнородных источников, и даже нельзя гарантировать корректность работы текущих алгоритмов, еще не познал всей сложности человеческого здравого смысла и в постоянном изменении выводимой информации, не говоря уже о том, чтобы на основе таких данных строить карту знаний, принимать решения.
Учитывая очевидные недостатки автоматизированного сбора информации для построения графов знаний, как насчет того, чтобы попытаться построить графы знаний с помощью человека? Ручное построение позволяет не только воспользоваться дивидендами многолетних осадков знаний экспертов в различных областях, но и избежать принятия алгоритмом решений, противоречащих человеческой морали или эмоциям. Это даже позволяет отслеживать информацию, чтобы гарантировать качество данных.
(Resident Evil Red Queen).
Преимуществ много, но до сих пор ручное построение графа знаний не получило широкого распространения, что же произошло в середине? Потому что ручное построение относительно медленно, часто не успевает за эволюцией информационных идей и является более (трудо)затратным.
Разве качество и эффективность построения графа знаний не будут неуклонно повышаться, если ручной труд совместить с автоматизацией? Это уже придумано и сделано.
Если в форме поэтапного стимулирования перед вступительными экзаменами в колледжи и университеты собрать большое количество преподавателей и профессоров, нынешних/выпускных студентов и представителей общественности колледжей и университетов для оценки колледжей и университетов, затем выявить и отсеять экспертов в области образования и консультантов для подачи документов на экзамен, а затем интегрировать и упаковать информацию с помощью алгоритмов и передать ее в организации по консультированию абитуриентов, приемные комиссии колледжей и департаменты образования для формирования графа знаний, то можно будет сформировать граф знаний для абитуриентов по всей стране. Доверительное консультирование по вопросам поступления, исключающее потерю талантов из-за разницы в информации.
Именно это и пытается сделать Epik Protocol (Эпик Протокол). Это платформа для совместной работы с графами знаний, основанная на технологии блокчейн. С помощью стимулов она организует пользователей по всему миру для совместной работы по сортировке знаний в различных областях в граф знаний, который постоянно хранится в распределенном виде, обеспечивая постоянный поток высококачественных данных для существующих языковых моделей ИИ, что способствует применению графов знаний в сфере производства и жизни.
В системе протокола МК существуют три основные роли: охотники за головами могут свободно собирать задания в различных доменах знаний и отправлять их на приемку; эксперты домена отвечают за разборку и приемку профессиональных заданий и загрузку данных майнерам знаний; майнеры знаний могут осуществлять власть управления и участвовать в выборе и голосовании экспертов домена для поддержания доброкачественного развития экосистемы. Начиная с производства данных, их приемки и заканчивая отбором профильных экспертов, сформировался набор эффективных замкнутых циклов управления производством.
Кроме того, скучный процесс проверки данных инновационно отражен в форме игры: участвуя в идентификации и проверке данных, охотники за головами смогут получить соответствующее вознаграждение. И не стоит беспокоиться о том, что сложность игры слишком высока, ведь есть эксперты, которые хорошо поработали над разделением сложности. В процессе игры необходимо завершить ручную обработку данных, при этом повышая свой уровень и получая награды, соглашение Mingcheng в такой форме призвано привлечь к участию в ней больше охотников за головами, чтобы компенсировать недостаток эффективности и качества ручного построения графа знаний.
Куда девать уже отфильтрованные и обработанные данные? Технология блокчейн играет в свою силу. Чтобы удовлетворить спрос на упорядоченное хранение данных в конкретных доменах, протокол Minnow имеет явные требования к качеству данных, а их хранение является полностью бесплатным. Они собирают упорядоченные маленькие копии лог-файлов графа знаний в каждом домене, а затем регулярно синтезируют маленькие копии лог-файлов в каждом домене в большие snapshot-файлы и загружают их в Filecoin, открытый рынок распределенного хранения данных, для резервного копирования snapshot, что играет на преимуществах холодного хранения больших файлов в Filecoin, продолжая при этом предоставлять достоверные данные.
Майнеры знаний, как посредники при загрузке данных, являются важнейшей частью системы протокола MKI, и, конечно, они не вернутся с пустыми руками. Дотации на пропускную способность и резервы фонда знаний - вот доходы от их труда.
Вручную + автоматизация - этот полуавтоматизированный метод построения графов знаний еще некоторое время будет оставаться основным, особенно в таких областях, как здравоохранение, безопасность и финансы, где требования к качеству данных высоки, а точность необходимо обеспечивать путем ручного анализа.
Исследования в области построения графов знаний подошли ко второй половине. Неотъемлемой частью этого направления, а также частью конкурентной борьбы между различными предприятиями и организациями станет совершенствование средств построения замкнутых графов знаний и упрощение совместной работы.
Тот, кто отличится в этой области, получит возможность и шанс первым получить билет в эпоху Web 3.0.
Рекомендуемые новости