日本のDiscourse - Good Loop

Discourse AIのご紹介

Admin 2023 年 4 月 24 日午後 12:00 1

Falco
Apr 24, 2023 • 6 min read

Discourse AIをご紹介できることを嬉しく思います。これは、人工知能をDiscourseコミュニティに統合するための第一歩です。この新しいプラグインは、新機能の提供と既存機能の強化を兼ね備えたオールインワンのソリューションです。

この最初のリリースでは、7つの異なるDiscourse AIモジュールを提供しています。これらのモジュールは、コミュニティマネージャー、メンバー、モデレーターが、検索や新しいトピックの探索に関するセマンティック関連の提案、感情分析、毒性検出、トピックやチャットの要約、NSFW画像検出、校正・編集提案・翻訳などの投稿改善機能といったタスクをこなせるよう設計されています。

これらの各機能の詳細と、今後のロードマップについてもぜひ読み進めてご確認ください！

Discourse AIモジュール

Discourse AIでは、すべての機能を単一のプラグインにまとめ、コミュニティのニーズに応じて個別に有効化できる独立したモジュールとして提供することにしました。

また、特定の企業のAPIに縛られないことも優先事項の一つとしており、すべてのコミュニティがデータプライバシー、パフォーマンス、機能セット、ベンダーロックインのバランスを考慮しながら、自分たちに合ったプロバイダーを選択できるようにしています。

それでは早速、今日から使い始められるモジュールをご覧ください。

セマンティック関連トピック

トピックの最後まで読み進めると、Discourseは次に読むべきトピックの候補を5件提示します。現在は、匿名ユーザーには5件のランダムなトピックを、ログイン済みユーザーには未読トピックをそのリストに使用しており、生成は素早いものの、特定のテーマを調べている場合にはあまり役立ちません。

新しいセマンティック提案機能では、現在のトピックとインスタンス内の他のすべてのトピックの間でセマンティックテキスト類似度を使用し、ユーザーが求めているものとの関連性がより高い可能性のあるトピックを提案します。

ビデオゲームに関するトピックには似たようなゲームや続編が、テクノロジーに関するトピックには関連する他の技術が、新しいバンドのアルバムに関するトピックには同じバンドの他のアルバムや類似のものが提案されます。

この新しい関連トピック機能はMetaで数週間にわたって運用してきており、これまでの結果にとても期待しています。

このDiscourseの機能リクエストに関連するセマンティック関連トピックのリスト

コミュニティセンチメント

センチメントモジュールでは、コミュニティのすべての投稿を、感情（ポジティブまたはネガティブ）および/または情緒（喜び、驚き、怒り、嫌悪、恐れ、悲しみ、またはニュートラル）によって自動的に分類します。これにより、スタッフチームはコミュニティの健全性に関する貴重なインサイトを得ることができ、カテゴリー、トピック、ユーザーレベルなどさまざまな軸でのセンチメント分析が容易になります。

ユーザープロフィールページのユーザー全体のセンチメント - 将来のUIモックアップ

時系列でのコミュニティ全体のセンチメント - 将来のUIモックアップ

コンポーザーAIヘルパー

次のようなシナリオを自分自身や知り合いが経験したことはありませんか？

お気に入りのDiscourseインスタンスで新しいトピックを書こうとしているが、良いタイトルがなかなか思いつかない。命名は難しいものです！

トピックに返信しようとしていて、内容は十分に理解できて役立てると思うのに、同じ言語でしっかりと考えた返信を言葉にするのが簡単ではない。

それなりの長さの投稿を書き終えたが、論点はしっかりしているものの、全体を見直す時間があればもっとうまく表現できると思いつつも、そんな時間はなかなか取れない！

私たちも同様の状況に何度も直面してきたため、Discourse上でのコミュニケーションを円滑にするために、コンポーザーAIヘルパーモジュールを作成しました。

投稿を作成した後、アイコンをクリックして以下のオプションからいずれかを選択してください。

タイトルの提案
英語に翻訳
校正
表を作成

そして数秒後に、AIからのサポートが得られます。

トピックでAI校正を行った例

AIヘルパーモジュールによって生成された5つのトピックタイトルの提案

毒性検出

毒性モジュールは、新しい投稿やチャットメッセージをスキャンし、さまざまなラベルにわたる毒性スコアで分類します。これらの毒性スコアはすべてレポートで確認でき、コミュニティのモデレーターはインスタンスに適切でない可能性のあるコンテンツを特定することができます。

さらに一歩進めたい場合は、カスタマイズ可能な毒性閾値を超えたコンテンツの自動フラグ付けを有効にすることもできます。これにより、問題のある可能性のあるコンテンツがDiscourseレビューキューに入り、モデレーターチームによる手動での確認が可能になります。

毒性があるとみなされ自動的にフラグが付けられた投稿の例

NSFW画像検出

NSFWモジュールは、ユーザーの投稿内のすべての新しいアップロードを自動的にスキャンし、一般的に不適切とされるコンテンツについて各画像を分類します。分類のコンテンツはモデレーターチームへのレポートで確認でき、オプションで、一定の閾値を超えたコンテンツの自動フラグ付けを有効にすることもできます。

NSFW画像が含まれているため自動的にフラグが付けられた投稿の例

セマンティック検索

関連トピックと同じエンベディング技術を使用して、フルページ検索にセマンティック検索オプションも導入しました。これは、単なるキーワードではなく、完全な文章による質問で検索する場合に特に有用です。

検索における完全な文章に対して、標準的なDiscourse検索とセマンティック検索を使用した場合の違いの例

要約

要約モジュールは、トピックやチャットチャンネルの短い要約をユーザーに提供し、長い議論の概要を数秒で把握できるようにします。

DiscourseのUI変更アナウンストピックのAI生成要約の例

モジュールプロバイダー

上述のとおり、私たちはプライバシーを損なうことなく新しいAI機能を提供することに取り組んでいます。各モジュールの現在のプロバイダーとモデルについては以下をご覧ください。CDCKは、私たちのインフラでのオープンソースモデルのホスティングと、OpenAIのようなSaaSプロバイダーのAPIキーを管理しています。

毒性検出はhttps://github.com/unitaryai/detoxifyを使用しています
センチメントはhttps://huggingface.co/j-hartmann/emotion-english-distilroberta-baseとhttps://huggingface.co/cardiffnlp/twitter-roberta-base-sentiment-latestを使用しています
NSFW検出はhttps://github.com/GantMan/nsfw_modelとhttps://github.com/bhky/opennsfw2を使用しています
セマンティック関連トピックとセマンティック検索は、エンベディングの生成にhttps://github.com/UKPLab/sentence-transformersまたはOpenAIのいずれかを使用し、ストレージと検索にはhttps://github.com/pgvector/pgvectorを使用しています
コンポーザーAIヘルパーはOpenAIまたはAnthropicのそれぞれのAPIを使用しています
要約はhttps://huggingface.co/philschmid/bart-large-cnn-samsum、https://huggingface.co/philschmid/flan-t5-base-samsum、https://huggingface.co/pszemraj/long-t5-tglobal-base-16384-book-summary、OpenAI、またはAnthropicを使用しています

既存のモジュールに他のプロバイダーの追加をご希望の場合は、お知らせください。お客様の選択肢を増やすべく取り組んでいます。

今後の予定

本日提供する機能をお客様のフィードバックに基づいて改善し続けることを楽しみにしており、Discourseでのコミュニティ体験を豊かにするために追加すべきアイデアも数多くあります。いくつかの例を挙げると：

画像からのテキスト抽出
PII検出
AIを使用したトピックサムネイルの生成
自動画像キャプション
絵文字のコンテキスト提案

常にお客様のフィードバックを歓迎しておりますので、以下のコメント欄でご意見をお聞かせください。

免責事項

私たちはAIに関する実験を非常に慎重に行っています。私たちが依拠するアルゴリズムは、学習に使用されたデータと同程度の品質しか持ちません。バイアス、不正確さ、ハルシネーションはすべて考慮すべき可能性です。AIモジュールは定期的に見直し、テスト、改良を行っています。

AIモジュールに問題のある事象を発見された場合は、ai-safety@discourse.orgまでご連絡ください。

コミュニティへのDiscourse AIのインストール

本日より、すべてのエンタープライズのお客様にDiscourse AIプレビューをご提供します！インスタンスへのインストールおよび設定については、サポートチームまでお問い合わせください。

お客様からのフィードバックと実際の使用状況に基づいて、他のホステッドプランでの提供を検討してまいります。ご興味のある方はteam@discourse.orgまでお問い合わせください！

自身のサーバーでDiscourseをセルフホストしている場合は、OpenAI / Anthropicに依存するモジュールをすぐにご利用いただけます。また、オープンソース搭載モジュールのご利用については、MetaのセルフホスティングDiscourse AIトピックガイドをご確認ください。

原文はこちら：

Good Loopでは、Discourseのセルフホスティングを安価で提供しています。開発元であるCDCK社の協力のもと、公式ブログ記事の翻訳・公開など、日本での普及にも努めています。

詳しくはこちら: Discourseの導入・運用支援・コンサルティング – Good Loop

Discourse 3.2 のリリースをお祝いします

Discourse 3.1 が登場しました！