Enterprise Knowledge Graph の概要

Enterprise Knowledge Graph は、サイロ化された情報を組織の知識に整理します。たとえば、効率的かつ有用な方法でデータの統合、標準化、調整を行います。

Entity Reconciliation API

Entity Reconciliation API は、表形式データ向けの軽量な AI 搭載のセマンティック クラスタリングと重複排除サービスです。これは、Google のコア エンティティ解決エンジンをラップするスタンドアロン API です。お客様は、この API を使用して、データを調整して結合したり、データを 1 つ以上のサードパーティ データセットと結合したりできます。

主な特長は以下のとおりです。

  • Google データを使用した最先端の品質の事前トレーニング済みモデル。
  • ジオコーディングなどの組み込みエンティティ エンリッチメント。
  • 最大数十億のノードと数兆のエッジを持つグラフを処理する Google スケールのクラスタリングと調整。
  • 安定したマシン ID(MID)は、エンティティ クラスタごとに一意の識別子です。
  • 最大 10 個の BigQuery テーブルをネイティブにサポート。

仕組み

Enterprise Knowledge Graph のコンセプト

リレーショナル データベースでは、照合は主に厳密に管理されたキー(顧客 ID など)を使用して行われます。一部のデータベースでは、あいまい一致(「Robert Smith」と「Bob Smith」など)がサポートされています。グラフでは、あいまいテキスト、共通の関係、エンティティ タイプ、その属性の任意の組み合わせを使用して照合が行われます。これは、さまざまなシステムのデータを結合する場合に有効です。

Entity Reconciliation API は、エンティティ タイプと共通スキーマにマッピングされたファイルのセットを指定して、ソース BigQuery テーブルからデータを読み取ります。次に、ナレッジ抽出を実行して、入力リレーショナル データをRDF 三つ組のようなナレッジグラフ表現に変換します。Google エンティティ調整エンジン は、グラフを構築してエンティティをさまざまなグループにクラスタ化します( 同じグループ内のエンティティは一致と見なされます)。最後の手順では、リンク結果(一致と不一致)を新しい固有識別子列(MID)の形式で、お客様が指定した BigQuery テーブルに出力します。

Google Knowledge Graph Search API

キーワードで検索したり、Google ナレッジグラフで ID を使用してエンティティを検索したりするには、Google Knowledge Graph Search API を使用します。この API は標準の schema.org タイプを使用し、JSON-LD 仕様に準拠しています。

この API を使用すると、次のことができます。

  • 組織、プロダクト、場所、書籍、映画など、さまざまなエンティティに対してエンティティ解決を実行します。
  • 非公開エンティティをグローバルに一意の Cloud ナレッジグラフ マシン ID(MID)にリンクします。
  • 特定の条件に一致する最も注目すべきエンティティのランク付けされたリストを取得します。
  • Google ナレッジグラフ エンティティを使用してコンテンツにアノテーションを付け、整理します。
  • Google ナレッジグラフ Search API から返される追加の ID(Google プレイス ID など)を使用して、より広範なデータ エコシステムに接続します。
  • Cloud Vision APICloud Natural Language APICloud Video Intelligence API などの他の Google Cloud API から返された MID からエンティティを検索します。

Google ナレッジグラフ Search API のエディション

Google Knowledge Graph Search API には、次の 2 つのエディションがあります。

  • Basic
  • Advanced

どちらのエディションも、エンティティの検索とルックアップをサポートしています。また、 Google Cloudで構築された同じベース ナレッジグラフ エンティティを提供します。Enterprise エディションには、Google プレイス ID へのリンクや追加のデータ カバレッジなどの追加機能が含まれています。

新しいプロジェクトを計画している場合は、Cloud ナレッジグラフ Advanced エディションでアプリケーションを構築し、新しい機能と改善されたサービスを利用してください。Basic エディションは引き続き利用できますが、新機能、高い QPS、追加のセキュリティとコンプライアンス基準はサポートされていません。

2 つのエディションの比較については、Basic エディションと Advanced エディションの比較をご覧ください。