Sign in

2023年6月8日

新デモ動画:PDFファイルを参照したQ&A 🎬

質問と回答

本日は、Q, ChatGPT for Slack が、企業の製品や業務に関する PDF ファイルを参照する方法を示すデモ動画を共有したいと思います。例として NVIDIA の最新の GPU マニュアルを使用致します。

背景にある課題

あなたの会社には様々なマニュアルやガイドがありますか?それらはあなたの会社の製品やサービス、または内部の業務フローに関する資料だったりすると思います。それはまさに会社の「資産」ですよね。

しかし、これらの本来重要な資料が、社内で十分に活用されない問題というのはよくあります。メンバーがそれらを探すのにそもそも苦労したり、どこに何が書いてあるのか良くわからなくて、使いこなせなかったりすることがあります。そうすると、経験が長く、その会社や業界のドメイン知識が豊富な一部のコアメンバーが、その他大勢のメンバーからの質問の対象となったりします。その結果、コアメンバーが自分の仕事が出来ずに生産性が落ちたり、逆にコアメンバーからの返信がないのでその他全体の生産性が落ちたりします。

質問が活発なうちはまだ良いかもしれませんね。そうではなくて、例えば、比較的ドメイン知識の少ない社歴の浅いメンバーや新入社員達が、コアメンバーには質問しづらいし、かと言って資料を見るわけでもない、というパターンもあるでしょう。その結果、なんとなく知らないまま過ごしてしまうシーンもよく見ます。これもまた、生産性が下がる原因になります。

しかし、その PDF マニュアルを「Q, ChatGPT for Slack」に与えることで、そういった問題を今より解決出来るかもしれません。ChatGPT が、あなたの Slack ワークスペースでのみ、あなたの会社の内部情報に精通出来たら、と考えたら、色々と想像が広がりませんか?

具体的な方法

今回のデモ動画では、「Q, ChatGPT for Slack」があなたの PDF マニュアルに直接アクセスし、質問に回答することで、これらの問題を軽減できる可能性を示しました。

1 つ 1 つ詳しく見てみいきましょう!🚀

ステップ 1: PDF をアップロードする

まず、Q に PDF を読み込ませる必要があります。やり方は簡単で、Q との DM タブに PDF を送信するだけです。それでその PDF を Q にアップロードすることができます。

You can upload a PDF simply by sending it in a direct message tab with Q

PDF の処理にかかる時間はそのファイル容量によりますが、例としての NVIDIA GPU マニュアルの 160 ページでは、数秒でしたのでそこまで待つことはないはずです。また、一気に 2 つ以上の PDF を同時にアップロードすることも可能です。アップロードされたファイルそのものは保存しません。Q は、アップロードされたファイルを読み込み、その内容を 1,536 次元のベクトル化して、そのベクトルを保存します。アップロードされた PDF ファイル名は、後でホームタブに表示されますので、削除することも可能です。

ステップ 2: プラグインを有効にする

次に必要なプラグインをオンにします。ChatGPT のプラグインと同じイメージです。Q のホームタブに、プラグインのセクションがあります。ここで、使用したいプラグインを選択して下さい。今回は、「事前アップロードしたドキュメント検索」をオンにします。

Activate Your Plugin, Pre-Uploaded Document Search for Q, ChatGPT for Slack

これにより、Q はアップロードされたドキュメント(PDF だけではなく、URL、GitHub リポジトリのソースコードも対象)を検索することが可能になります。今回は、PDF に焦点を当てますので、他のドキュメントは使いませんが、複数のファイルがアップロードされた状態でも OK です。

これで、質問を始める準備が整いました!

ステップ 3: 質問する

まず、今回の題材では ChatGPT は答えられないことを確認しました。元々答えられるものだと実験にならないからです。今回想定する資料は、あなたの会社の製品や運営に関する資料なので、それらは基本的に WEB 公開されないものなので、この ChatGPT が回答出来ないケースに該当します。ちなみに、WEB 公開されている資料でも、2021 年 9 月以降に公開されたものも学習されていません。

さて、今回のデモ動画では、以下のような質問を投げかけてみました:

質問 1: "NVIDIA GeForce RTX 4090 は分かりますか?"

このデモでは、例として、2021 年 9 月以降にリリースされた NVIDIA の GPU の最新マニュアルをアップロードしました。そして Q に質問してみると、見事、知ってるよ、という回答とともに、GPU を購入すると同梱されてくるセットを挙げてくれました。また、その情報はどこから参照したのか、具体的なファイル名とページ番号も提供してくれました。

Question 1: Do you know NVIDIA GeForce RTX 4090?

質問 2: "(この GPU を使用するにあたり)必要となるものは何ですか?"

この質問においても、Q は回答することが出来ました。必要なマザーボードのスロット(インターフェース)のバージョンや、同梱された付属の専用アダプターを必ず使用しなければならない、などの回答を提供することができました。

Question 2: Is there anything required? in Slack

ただし、最低でも 850W の電源が必要なことや、OS に関しては Windows 11 の 64-bit が推奨であるなどについては、言及されませんでした。本当ならばここもしっかり言及してほしいところです。ただ、これは質問が少し広すぎたかもしれません。もしくは更問すると教えてくれたかもしれません。どういった改善方法がありえるのかについては後で紹介します。

質問 3: "どのようにインストールしますか?"

同じように、Q は詳細にインストール手順を記載してくれました。ただ、ここでも、マニュアルに記載されているが、言及されなかった注意事項等がありました。ここでのポイントは、現段階では、PDF の内容を何でも完璧に拾えるわけではないものの、こうした簡単な手順で、既にある程度の知識を身に着けることが出来た、という点です。

Question 3: How do I install it? in Slack

更に改善する方法

実は、この回答のクオリティを高める方法が大きく 2 つあります。質問の仕方を改善することと、使用した PDF ファイルの品質を改善することです。

質問の仕方を改善する

最初から気張る必要はありません。最初は、雑に、だいたいの表現で質問すればいいのです。雑に聞いてもQはそれをよしなに解釈する力があります。しかし、それでは望む回答が得られなかった場合は、以下のことを試してみて下さい。

  • 質問を別の言い方に置き換える
  • 知りたいことをもっと具体的に述べる
  • 代名詞があれば、それを具体的な名詞に置き換える
  • 文章中の主語、述語、目的語を明確にする(日本語は特に主語がないケースが多い)
  • または、新しい Slack のスレッドで聞きなおす

最後のポイントは、効果があります。毎回毎回明確に質問するのは、それはそれで面倒ですから、Q は、そのスレッドの直近のやりとりを用いて、PDF の中身を検索します。厳密には、400 ~ 500 文字程度に小さく分割されてベクトル化された PDF に対して、同じくスレッドの直近の内容をベクトル化したもので、類似度マッチング検索を行います。したがって、新しいスレッドで聞きなおすことによって、より直近の質問にフォーカスした検索が行われることになるためです。

他の三つのポイントについても、Q に限らず、AI と話す際には有用な基本的なテクニックです。

PDF ドキュメントの品質を改善する

そもそもの PDF ファイルの品質を改善する方法もあります。PDF は作り元が分からず、再作成できないことも多いのですが、もし PDF の元データが編集可能だったり、Adobe で直接編集できる場合は、以下を試すことも出来ます。

  • 不要な改行を出来るだけ削除する(内容的に同じものの中には、改行がない状態が望ましい)
  • 複数ページにまたがるセクションやヘッダーは、各ページにその文字列を明示する
  • 赤字や太字など視覚的な強調は、【重要】や【注意事項】などの文字列で明記する

2023 年 6 月時点の OpenAI GPT-3.5 および GPT-4 はトークンの数に制限があり、AI が一度に読み書きできる文章の文字数に限界があります。特に日本語は英語に比較して少ない文字数しか扱えないことが多いです。したがって、PDF マニュアルのような長い文章の場合、それをある程度小さい単位(=チャンク)に分割します。その分割の主なセパレーターは PDF の場合、改行であるため、不要な改行を極力排除することは効果的です。そうでなければ、同じ内容でもチャンクが分割されてしまい、検索出来ないことが起きやすくなります。

また、注意事項が注意事項であると明確に文字で示すことも効果的です。赤字や、太字、赤枠などの視覚効果で強調されたものは人間にとって分かりやすいですが、AI にとって読ませることが出来ません。厳密には、PDF ファイルの内容はテキストではなく、0, 1 のバイナリ形式で保存されており、そのバイナリから文字列に起こす際にそのような視覚情報が失われてしまうためです。

また、複数ページにまたがるセクションやヘッダーについても同じです。人間は各ページに毎回セクションが載ってなくても続きであるとわかりますが、先述した事前処理において、どうしてもチャンクが別々に分かれてしまうため、各ページにセクションやヘッダーが毎回明記されていた方が効果的です。ちなみに、マークダウン等においては、セパレーターに「##」などが使用できるため、各セクションの開始と終了が明確に取得できたりしますが、PDF ではこうした手法が使えないため、こうした工夫が効く場合があります。

総括

もし、PDF 参照機能をご利用されていて、分からないことやご質問等ございましたら、お気軽にご相談下さい。もしくは、あなたの Slack ワークスペースから Slack Connect を使用してinfo@suchica.comを招待すれば、あなたの Slack ワークスペースから弊社のカスタマーサポートチームと DM でやりとりすることも可能です。Slack Connect は DM のみであれば無料です。一部のお客様とは既に Slack Connect で会話しております。

新しいツールと同じく、最初はいくばくかの慣れでしたり、学習曲線があるかとは思いますが、一旦慣れて頂ければ、Q があなたの仕事の生産性をより高めてくれると信じております。社内の Q&A に課題があるのは明白です。最終的には PDF を読むべきですが、もっとライトにアクセスできる方法として、今回の手法を提案致します。いつも会話する感覚で Q に質問を投げかけるだけです。

改めて、Q があなたの会社の PDF ファイルに関する質問にうまく回答できなかった場合は、ぜひご相談ください。もし可能であれば、うまくいかなかった PDF と質問文を提供していただけると、より詳細に調査し、改善できる可能性が高まります。

今回は以上です。百聞は一見に如かず、まだ Q を試されてない方は、是非この PDF 参照機能をお試しください。

14-days free trial.
No credit card required.
The first day of the trial is GPT-4!

Copyright 2024 Suchica, Inc. All rights reserved.