タクソノミー統合報告:分類体系の標準化とNotionデータベースへの反映

本報告書は、当組織における分類体系の整理と標準化作業の完了について詳述します。このプロジェクトの目的は、「カテゴリー」「サブカテゴリー」「キーワード」からなる3層の用語体系を一貫性のある形で確立することでした。その結果、Notionデータベース(L1-L3)の更新と、OpenClawマスターファイルの作成が完了しました。

現状調査とその課題

まず、4つのNotionデータベースと2つのウェブソースについて現状調査を行いました。Notionデータベースでは、L1(Climate Library)に4種類のカテゴリー、42種類のサブカテゴリー(表記揺れや重複が多数存在)、および自由形式のキーワードが確認されました。L2(Blog Repository)とL3(Insight Builder)には、それぞれ4種類のカテゴリーと17種類のサブカテゴリー、そして自由形式のキーワードが見つかりました。一方、L4(Abduction Engine)は分類体系の対象外でした。ウェブソースの調査では、Climate Libraryのウェブサイトに4種類の記事カテゴリーが、Climate Networkのウェブサイトには8種類のナビゲーション記事カテゴリーと6種類のAgentが確認されました。この調査により、サブカテゴリーの定義に大きなばらつきや重複があることが明らかになりました。

サブカテゴリーの標準化

これらの課題を解決するため、L1のサブカテゴリーの粒度をL2/L3の粒度に合わせる方針で、42種あったサブカテゴリーを21種に正規化しました。具体的な変更は以下の通りです。

Capital カテゴリーは、既存の4種類に「Private Equity」を追加し、5種類に増やしました。 Solutions カテゴリーは、既存の4種類に「Adaptation」「Oceans」「Nature」を追加し、「Transport & Mobility」を独立させることで、合計8種類としました。 Policy カテゴリーは、既存の6種類に「Japan Climate Policy」を追加し、3件の名称変更を行い、7種類としました。 Science カテゴリーは、既存の2種類を「Climate Science」の1種類に統合しました。

NotionデータベースとOpenClawファイルの更新

サブカテゴリーの標準化に伴い、NotionデータベースとOpenClawのマスターファイルを更新しました。L1、L2、L3のNotionデータベースでは、「Subcategory」の選択肢を新しい21種類に統一しました。NotionのSELECTプロパティではカンマを使用できないため、「Food Agriculture & Land Use」のようにカンマなしで表記を統一しています。

また、OpenClawシステム向けに2つのマスターファイルを新たに作成しました。

  • taxonomy.md: このファイルには、標準化された4種類のカテゴリー、21種類のサブカテゴリー、統制語彙化されたキーワードが定義されています。さらに、Climate Networkの記事カテゴリーとのマッピング情報や、L1の旧サブカテゴリー値から新サブカテゴリー値への移行表も含まれています。
  • job-categories.md: このファイルには、6種類のAgentのPosition、Role、Category、Subcategoryのマッピング情報と、5種類のPosition体系が定義されています。
  • キーワードの統制語彙化

    taxonomy.mdファイルには、キーワード層も追加されました。これには、各サブカテゴリーに特化したキーワードリストに加え、横断的に使用できる地理的キーワード(14語)と組織的キーワード(11語)が含まれています。さらに、キーワードの適切な利用を促すための6つの使用ルールも明記されています。

    今後の対応

    今回のタクソノミー統合にあたり、以下の決定がなされました。

    Climate Networkの記事カテゴリー(Climate/Energy/Policy/Technology/Nature/Oceans/Agriculture/Finance)は、サブカテゴリーの表示用エイリアスとして扱い、独立した分類としては導入しないことになりました。 Job CategoriesはNotionデータベースには含めず、OpenClaw内の.mdファイルとして管理し、Agent定義時に参照することになりました。 L4(Abduction Engine)は仮説検証エンジンのため、引き続き分類体系の対象外とします。 既存のレコードに存在する旧サブカテゴリー値は残存させ、新規登録分から新しい21種類の値が適用されます。

    これらの変更に伴い、OpenClawシステムにはtaxonomy.mdjob-categories.mdの2つの新しいファイルが追加されました。また、NotionのL1、L2、L3データベースにおける「Subcategory」の選択肢が変更されています。

    今後、以下の作業を進めていく予定です。

    既存のL1レコードに残る42種類の旧サブカテゴリー値を、新しい21種類の値へ移行する作業を実行します。 Climate LibraryウェブアプリケーションのフィルターUIを、新しいサブカテゴリーに対応するよう更新します。 Climate NetworkウェブアプリケーションのAgentタグを、新しく定義されたJob Categoriesと連携させます。 キーワードフィールドに既存の自由形式で入力されているテキストを、段階的に統制語彙へ移行させます。