アライン株式会社、生成AIを利用したファイル検索サービス「デジタルライブラリ」を提供開始
PR TIMES / 2024年7月23日 13時15分
キーワード一致ではなく、検索意図を理解した類似検索ができるサービス
アライン株式会社(代表取締役:清水 剛、以下「アライン」)は、2024年7月23日よりファイル検索サービス「デジタルライブラリ」をリリースしたことを発表します。
デジタルライブラリは、共有ストレージにアップロードされたあらゆる形式のファイル(テキスト、画像、PDFなど)の内容を解析し、ユーザーの検索意図を汲んだ検索を行う生成AIを利用した検索サービスです。
デジタルライブラリの検索画面イメージ
デジタルライブラリでは、例えば「デジタル化」をキーワードとして検索した場合に、「DX」などの関連キーワードも一緒に抽出して質問意図に合致する資料を表示することができます。
[画像1: https://prcdn.freetls.fastly.net/release_image/85096/9/85096-9-efc5be3b0030e140330a13e220075885-2331x1351.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
デジタルライブラリの主な特徴
- 「登録」「検索」のみのシンプルなサービス!
- ユーザーの検索意図に沿った類似検索ができる
- 数百ページに及ぶ大きなファイルでもページ単位で解析・検索できる
- OCRにより画像やPDFなどのファイルに含まれるテキストも解析・検索できる
- 英語や日本語の他、あらゆる言語に対応している
デジタルライブラリの仕組み
キーワード一致ではなく類似検索を可能にする仕組みとして、ファイルの登録時に作成するEmbeddingと呼ばれるベクトルデータベースを採用しています。ファイルに含まれるテキストデータを解析・抽出して、ページごとにEmbeddingとしてベクトル化してデータベースに保存します。
検索時には、ユーザーが入力したキーワードやセンテンスも同様にEmbeddingとしてベクトル化し、データベースの全てのベクトルと総当たりでコサイン類似度を計算します。最終的に、コサイン類似度が高い順に、ファイル名、表紙のサムネイル、該当ページ番号、該当ページに含まれるテキストの一部抜粋を表示します。
[画像2: https://prcdn.freetls.fastly.net/release_image/85096/9/85096-9-be27f956771cb3f93f4ead76f2dbfd15-2641x1482.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
ファイル内のテキスト抽出にはGoogle社のCloud Vision APIによる光学式文字認識(OCR)を利用して、PDFや画像に含まれる文字もテキストとして抽出することができます。
また、ベクトル化にはVertex AIエンベディングモデルのうち、PaLM APIで利用可能な多言語テキストエンベディングモデル(textembedding-gecko-multilingual)を採用しています。
さらに、ベクトル化を行う生成AI(Gemini、ChatGPT、Claude 3など)は、ユースケースに合わせて任意に変更できます。
デジタルライブラリは、ご要望に合わせたカスタマイズも可能です。ご興味のある方は、弊社ホームページよりお問合せください。
問い合わせ先
下記URLのフォームからお問い合わせください。
https://www.aligns.co.jp/contact/
アライン株式会社の概要
社名:アライン株式会社(英語表記: ALIGN Inc.)
URL:https://www.aligns.co.jp
設立:2018年9月
事業内容:DXコンサルティング、SaaSサービス開発
代表取締役CEO:清水 剛
住所:東京都千代田区霞が関1-4-1 日土地ビル2F
【採用情報】
データエンジニア、システムエンジニアを募集中!
当社では業容拡大に伴い、データエンジニア、システムエンジニアを募集しています。
ご興味をお持ちの方は、以下のURLよりエントリーをお待ちしています。
採用ページ:https://www.aligns.co.jp/recruit/
企業プレスリリース詳細へ
PR TIMESトップへ
この記事に関連するニュース
-
たまにウソつく生成AIに「契約書管理」は無理? 「40年の歴史」持つ言語解析AIが再評価されるワケ
ITmedia ビジネスオンライン / 2024年7月11日 8時20分
-
モルフォAIソリューションズ、国立情報学研究所から学術論文用のAI-OCR開発を受託
PR TIMES / 2024年7月10日 12時15分
-
オラクル、HeatWave GenAIによる業界初のインデータベースLLMと自動化されたインデータベース・ベクトル・ストアを発表
PR TIMES / 2024年6月30日 22時40分
-
オラクル、インデータベースLLM備える「HeatWave GenAI」 - ベクトル処理で競合圧倒
マイナビニュース / 2024年6月27日 16時10分
-
DATAFLUCT、データプラットフォーム「AirLake」のデータ連携コネクタを拡充。HULFT Squareとの連携で、SalesforceやBoxのデータも自動で分析可能に
PR TIMES / 2024年6月25日 11時0分
ランキング
-
1「土用の丑の日」物価高でも…あの手この手の“うなぎ商戦” 大手スーパーの目玉は「超特大」
TBS NEWS DIG Powered by JNN / 2024年7月22日 19時59分
-
2「地方に多いホームセンター」が都会進出を狙う訳 人口減少が進む中、大手を軸に再編が進行
東洋経済オンライン / 2024年7月23日 8時30分
-
3「脱ママチャリ」電動自転車がここへ来て人気の訳 10万超でも高性能化、小型化で「1人1台」に?
東洋経済オンライン / 2024年7月23日 10時0分
-
4小林製薬、会長と社長が辞任へ…「紅麹」サプリ問題の対応遅れで経営責任明確化
読売新聞 / 2024年7月22日 21時37分
-
5円安は、バイデン大統領と共に撤退か
トウシル / 2024年7月23日 10時31分
記事ミッション中・・・
記事にリアクションする
![](/pc/img/mission/mission_close_icon.png)
記事ミッション中・・・
記事にリアクションする
![](/pc/img/mission/point-loading.png)
エラーが発生しました
ページを再読み込みして
ください
![](/pc/img/mission/mission_close_icon.png)