Jina
ウェブサイトのコンテンツをテキストに変換
Jina AIは、Simとシームレスに統合して、ウェブコンテンツをクリーンで読みやすいテキストに変換する強力なコンテンツ抽出ツールです。この統合により、開発者はウェブコンテンツ処理機能をエージェントワークフローに簡単に組み込むことができます。
Jina AI Readerは、ウェブページから最も関連性の高いコンテンツを抽出し、雑然としたもの、広告、フォーマットの問題を取り除いて、言語モデルやその他のテキスト処理タスクに最適化されたクリーンで構造化されたテキストを生成することを専門としています。
SimのJina AI統合により、以下のことが可能になります:
- URLを提供するだけで、任意のウェブページからクリーンなコンテンツを抽出
- 複雑なウェブレイアウトを構造化された読みやすいテキストに処理
- 不要な要素を削除しながら重要なコンテキストを維持
- エージェントワークフローでのさらなる処理のためにウェブコンテンツを準備
- ウェブ情報を使用可能なデータに素早く変換することで研究タスクを効率化
この統合は、ウェブから情報を収集して処理したり、研究を行ったり、ワークフローの一部としてオンラインコンテンツを分析したりする必要があるエージェントを構築する際に特に価値があります。
使用方法
Jinaをワークフローに統合します。ウェブサイトからコンテンツを抽出します。APIキーが必要です。
ツール
jina_read_url
Jina AI Readerを使用してウェブコンテンツを抽出し、LLMフレンドリーなクリーンテキストに処理します。高度なコンテンツ解析、リンク収集、および設定可能な処理オプションによる複数の出力形式をサポートします。
入力
パラメータ | 型 | 必須 | 説明 |
---|---|---|---|
url | string | はい | 読み込んでマークダウンに変換するURL |
useReaderLMv2 | boolean | いいえ | より良い品質のためにReaderLM-v2を使用するかどうか |
gatherLinks | boolean | いいえ | すべてのリンクを最後に集めるかどうか |
jsonResponse | boolean | いいえ | レスポンスをJSON形式で返すかどうか |
apiKey | string | はい | あなたのJina AI APIキー |
出力
パラメータ | 型 | 説明 |
---|---|---|
content | string | URLから抽出されたコンテンツ。LLMに適した形式のクリーンなテキストに処理されています |
注意事項
- カテゴリー:
tools
- タイプ:
jina