Sim

Jina

ウェブサイトのコンテンツをテキストに変換

Jina AIは、Simとシームレスに統合して、ウェブコンテンツをクリーンで読みやすいテキストに変換する強力なコンテンツ抽出ツールです。この統合により、開発者はウェブコンテンツ処理機能をエージェントワークフローに簡単に組み込むことができます。

Jina AI Readerは、ウェブページから最も関連性の高いコンテンツを抽出し、雑然としたもの、広告、フォーマットの問題を取り除いて、言語モデルやその他のテキスト処理タスクに最適化されたクリーンで構造化されたテキストを生成することを専門としています。

SimのJina AI統合により、以下のことが可能になります:

  • URLを提供するだけで、任意のウェブページからクリーンなコンテンツを抽出
  • 複雑なウェブレイアウトを構造化された読みやすいテキストに処理
  • 不要な要素を削除しながら重要なコンテキストを維持
  • エージェントワークフローでのさらなる処理のためにウェブコンテンツを準備
  • ウェブ情報を使用可能なデータに素早く変換することで研究タスクを効率化

この統合は、ウェブから情報を収集して処理したり、研究を行ったり、ワークフローの一部としてオンラインコンテンツを分析したりする必要があるエージェントを構築する際に特に価値があります。

使用方法

Jinaをワークフローに統合します。ウェブサイトからコンテンツを抽出します。APIキーが必要です。

ツール

jina_read_url

Jina AI Readerを使用してウェブコンテンツを抽出し、LLMフレンドリーなクリーンテキストに処理します。高度なコンテンツ解析、リンク収集、および設定可能な処理オプションによる複数の出力形式をサポートします。

入力

パラメータ必須説明
urlstringはい読み込んでマークダウンに変換するURL
useReaderLMv2booleanいいえより良い品質のためにReaderLM-v2を使用するかどうか
gatherLinksbooleanいいえすべてのリンクを最後に集めるかどうか
jsonResponsebooleanいいえレスポンスをJSON形式で返すかどうか
apiKeystringはいあなたのJina AI APIキー

出力

パラメータ説明
contentstringURLから抽出されたコンテンツ。LLMに適した形式のクリーンなテキストに処理されています

注意事項

  • カテゴリー: tools
  • タイプ: jina
Jina