Sign in

2023年6月8日

新示范:与你的PDF文件进行问答 🎬

问题与回答

今天,我想分享一个我制作的演示视频,展示了 Q(适用于 Slack 的 ChatGPT)如何帮助参考 PDF 文档,为你的公司的产品和操作提供参考,以 NVIDIA 的最新 GPU 手册为例。

背后的挑战

想象一下你们公司使用的各种手册和文档 - 关于产品、服务,甚至是内部流程。

往往,这些必不可少的材料被低估了。员工可能找不到它们,或者觉得它们太复杂而难以浏览。因此,一些具有广泛知识的个体成为了问题的默认去处,这降低了他们的生产力和整体工作流程。

或者考虑到远程团队和新员工,他们可能会犹豫是否寻求帮助,这导致他们要么进行过多的研究,要么根本不进行研究。再次,生产力受到影响。但是,通过利用 Q(适用于 Slack 的 ChatGPT),来回答你的 PDF 手册中的这些问题,我们可能可以帮助解决这些问题。

一步步的:这是如何工作的

我们最近的演示显示了“Q,适用于 Slack 的 ChatGPT”如何通过直接访问你的 PDF 手册的内容来回答查询,从而帮助缓解这些问题。

让我们一步步深入了解吧! 🚀

第一步:上传 PDF

你可以通过在与 Q 的直接消息标签中发送它来上传 PDF。处理 PDF 所需的时间将取决于其大小,但对于我们的 NVIDIA GPU 手册(共 160 页)来说,它几乎是瞬间的。此外,你可以同时上传两个或更多的 PDF。

你可以通过在与Q的直接消息标签中发送它来上传PDF

第二步:激活你的插件

转到主页标签,在那里你会找到一个插件部分。在这里,你可以选择你想要使用的插件。对于今天的目的,打开"预先上传的文档搜索"。这将使 Q 能够搜索你上传的文档,如 PDF、URL 和甚至 GitHub 存储库。今天,我们将专注于 PDF。

激活你的插件,预先上传的文档搜索,适用于Slack的ChatGPT Q

现在,你准备好开始提问了!

第三步:开始提问和回答

在演示中,我问了以下问题:

问题 1:“你知道 NVIDIA GeForce RTX 4090 吗?”

ChatGPT 的回答?当然是无法提供答案。

关于你公司的产品或操作的问答原则上最有可能不会得到回答。此外,网上可用的文档但在 2021 年 9 月之后发布的也不在覆盖范围内。

为了这次演示,我们别无选择,只能使用网上发布的 PDF,所以我们上传了 NVIDIA 在 2021 年 9 月之后发布的最新 GPU 的手册。然后我们把它喂给 Q,瞧!Q 回应了详细的信息,比如 GPU 随附的配件,甚至提供了文件名和页码供参考。

问题1:你知道NVIDIA GeForce RTX 4090吗?

问题 2:“需要什么?”

再次,Q 能够提供回应,比如需要的主板插槽类型以及需要使用附带的适配器。然而,像电源额定值和操作系统要求这样的详细信息却被忽略了。但这可能是由于问题的模糊性。这为改进和 hack PDF 搜索能力提供了机会。

问题2:需要什么?在Slack中

问题 3:“我该如何安装它?”

虽然 Q 提供了详细的安装流程,但它确实漏掉了手册中提到的一些具体内容。这里的重点不是完美,而是朝着目标迈出的重要一步。

问题3:我该如何安装它?在Slack中

关键收获:如何让这个适用于你

尽管我们还没有达到 AI 可以完美回答所有基于手册的查询的阶段,但它绝对正在朝着那个方向发展。而且,作为用户,你可以影响 AI 的性能的两个关键领域:你提问的方式和你使用的 PDF 文档的质量。

精炼你提问的方式

你应该从一个短的、宽泛或模糊的问题开始,这对你来说更容易。但如果你没有得到你想要的答案,可能值得尝试以下操作:

  • 用不同的方式提问
  • 具体说明你想了解什么。
  • 用具体的名词替换代词
  • 确保你的句子有明确的主语、谓语和宾语
  • 或者甚至切换 Slack 中的对话线索

特别是最后一点,更直接。Q 使用整个对话线索对分割成较小片段的 PDF 进行向量相似性搜索。因此,通过切换线索,你可以刷新搜索。

至于其他三点,它们也是与 AI 交谈时首先有用的重要基本技巧。

提升你的 PDF 文档的质量

在文档质量方面,如果你不介意重新创建 PDF,可能值得尝试以下操作:

  • 移除不必要的换行
  • 明确地标注重要部分
  • 在每一页都包含章节名

当前的 OpenAI GPT-3.5 和 GPT-4 有一个代币的限制,这限制了 AI 一次可以阅读或写入的文本数量。因此,对于长文本,如 PDF 手册,它会被分割成足够小的块来供参考。这种划分的主要分隔符是 PDF 中的换行,所以排除不必要的换行是有效的。

明确说明注释是注释也是有效的;对 AI 来说,任何通过视觉效果强调的信息,如红色文本、粗体文本、红色边框等,都是无法识别的,这种信息对 AI 来说是丢失的。严格来说,PDF 文件的内容是以二进制格式存储的,不是文本,当它被处理成文本时,所有这些视觉信息都会消失。

另外,对于跨页的部分,最好在每页上都有该部分的字符串,因为 PDF 虽然对人类来说是视觉可读的,但对 AI 来说,它充满了不必要的换行,而且章节不像 markdown 那样清晰。

结语

如果你对这个感到兴奋,我鼓励你去试试 Q。

此外,如果你使用 Slack Connect 邀请info@suchica.com,你还可以在 Slack 上与我们的客服团队进行聊天。Slack Connect 对于直接消息来说是完全免费的。我们已经有一些客户正在使用这项服务代替电子邮件。

像任何新工具一样,刚开始可能会有一些挑战和学习曲线,但一旦你掌握了它,你就会看到 Q 如何革新你的工作方式。不再需要在冗长、复杂的文档中寻找信息,只需问 Q,你就能得到答案。就这么简单。

如果有 Q 无法成功回答关于你的 PDF 文档问题的情况,请告诉我们。如果你能提供我们有问题的 PDF 和问题,我们可以更详细地检查并改进它!

14-days free trial.
No credit card required.
The first day of the trial is GPT-4!

Copyright 2024 Suchica, Inc. All rights reserved.