五分钟技术趣谈 | GPT-4——多模态大模型新特性与优势-51CTO.COM

Part 01 与GPT-3.5的区别

1.1 GPT-4文本输入字数大幅提升，可达25000字

图片

通常对语言模型来说，输入字数的提升有以下几个好处：

(1)理解和回应更长的文本：随着模型的输入容量增加，GPT-4将能够处理更长的文本输入。这对于处理长篇文章、技术文档或复杂的问题陈述可能会更有优势，可以更全面地理解上下文，并给出更详细和准确的回答。

(2)更好地处理上下文和连贯性：具备更大的输入容量有助于GPT-4更好地维护对话的上下文，并生成连贯的回应。更长的输入序列能提供更多关于对话历史和语境的信息，使其能够更好地理解用户的意图并生成更一致的回答。

(3)支持更复杂的任务和需求：拥有更大的模型输入容量可以使GPT-4处理更复杂的任务和需求。例如，对于涉及大量细节或需要考虑多个方面的问题，其可以接收更多相关信息并提供更全面的解答。

(4)提高对大型文本数据的理解能力：对于长篇文本、大规模数据集或大型知识库，具备更大的输入容量使GPT-4能够更全面地理解和处理这些数据。这也是GPT-4可以进行数据分析并通过专业考试的基础。

1.2 多模态输入→从识图到“懂梗”

下图是一个多模态输入与搞笑图片的案例：

图片

相比以文本为主的GPT-3.5，GPT-4的多模态的输入与深度含义理解具有以下意义：

(1)丰富输入信息：多模态输入意味着除了文本之外，还包括其他形式的信息，如图像、视频、音频等,这使大模型能够从不同的感知角度获取更全面、多样化的信息。通过结合多种模态的输入，从而更好地理解和回应用户的需求。

(2)支持更广泛的应用场景：多模态输入扩展了GPT-4的应用领域。除了处理文本交互外，GPT-4还可以参与图像描述、视觉问答、语音识别和合成等任务,这使得其能够在更广泛的领域和应用场景中发挥作用，并提供更全面和多样化的支持。

(3)促进多模态交互和体验：多模态输入有助于推动人机交互的发展，提供更丰富、自然的交互方式。通过结合多种感知模态，例如使用语音和图像进行交互，GPT-4可以更好地适应用户的习惯和偏好，提供更个性化和多样化的用户体验。

(4)支持创意和幽默的表达：梗通常是创意和幽默的表达形式，能够理解梗使 GPT-4 能够更好地参与到创意和幽默的对话中。这有助于提供更有趣、有趣和有个性的回答，增加与用户的互动和吸引力。

1.3 从数据分析到通过专业测试

GPT-4相比GPT-3.5,在处理分析图表、做题上都不在话下，而且更加聪明的GPT-4还很会考试，高分通过律师资格、SAT以及GRE考试，堪称完美碾压成绩排倒数前代GPT-3.5的“做题家”。

图片

GPT-4在这些领域上，具有以下意义：

(1)自动化数据分析：GPT-4 可以承担部分数据分析的工作，帮助人们更高效地处理大量的数据。通过对数据进行解析、提取关键信息和生成可视化报告，可以为决策制定和业务分析提供有价值的支持。

(2)减轻人力负担：数据分析通常需要大量的时间和资源来进行处理和解释。如果 GPT-4能够自动执行部分数据分析任务，可以减轻人力负担，提高工作效率。人们可以将更多的时间用于更复杂的数据解释和策略规划，从而提高工作的产出和价值。

(3)辅助决策制定：通过数据分析，GPT-4可以提供有关业务、市场趋势和用户行为等方面的见解。这些见解可以帮助决策者做出更明智的决策，优化业务流程和策略。GPT-4的分析能力可以提供客观、基于数据的决策支持，降低决策风险。

(4)教育和培训应用：如果 GPT-4能够通过考试，它可以在教育和培训领域发挥作用。它可以为学生提供个性化的学习支持，回答问题并提供解释和指导。此外，GPT-4还可以提供模拟考试和评估，帮助学生进行自我评估和准备考试。

Part 02 总结

GPT-4作为GPT的最新成果，具有很广阔的技术前景，是未来发展的核心能力之一，但也应注意，虽然GPT-4已经很强大，但仍旧存在局限性，比如错误识别方面，仍然可能产生幻觉，编造事实，在智力水平方面，不会从经验中学习，有时会犯简单的推理错误等，让我们进一步观察吧。

Part 03 AHP建模步骤举例

AHP建模步骤(图1)主要包括：层次结构指标模型的搭建、构造判断矩阵、单层次排序及一致性校验、层次总排序及一致性校验等多个实施步骤。本文我们将以某类智能家居产品体验评分模型为例来进行讲解和分析。

图片

3.1 搭建层次结构指标模型

在应用 AHP 分析决策问题时，首先我们就要把问题进行层次化，搭建一个有层次的结构指标模型，模型中层次的元素作为准则对下一层次有关元素起到支配的作用。例如构建某类智能家具产品体验评分模型，我们的一级指标定义为功能完备性、硬件可靠性、使用体验、终端性能，每个指标下面又细分为如图2的二级指标。

我们的层次结构指标模型中的层次数主要由问题的复杂程度以及需要分析的详尽程度决定。需要注意的是虽然一般层次数不受限制，但是每一层次中各元素所支配的元素一般尽量不要超过9个，因为当可支配的元素过多的时候，此时会给两两比较判断带来困难。元素也需要有相对独立的特征，如果相关度较高则会影响结果的准确性。

3.2 构造判断矩阵

第一步得到的层次指标结构反映了因素之间的关系，但在不同决策者的心目中元素指标所占的比重肯定是不同的，而且当影响某因素的因子较多时，如果直接考虑各因子对该因素的影响程度，可能会因为顾此失彼、考虑不全面得到一些与决策者心中不一致或者前后矛盾的结果。

为提供较为可信的数据，假设现在要比较n个因子对某因素的影响大小，我们采用对因子进行两两比较，最终建立成判断矩阵的办法。每次取两个因子，采用下表1方式比较，引用数字1~9及其倒数作为标度，全部比较结果用矩阵A表示。

这么说还是有些抽象，我们用以上标度为规则，来构建判断矩阵表格如下：

表中描述因子之间的相对重要程度，决定这些数值大小的可以是决策者的主观判断，也可以是基于调查或文献来判断，也可以是由专家讨论决定，上表中的值来源主观判断。不难理解，判断矩阵斜对角线对称元素应该是互为倒数的，同时判断矩阵的数值还应该遵守逻辑规范，否则无法通过后面的一致性校验。例如表2中，耐高温低温比防水性重要，防水性比耐摔性重要，如果我们填成耐摔性比耐高温低温重要，那肯定是逻辑错误。

3.3 单层次排序及一致性检验

层次单排序即根据判断矩阵计算对于上一层的一个指标元素，计算本层次与之有联系的所有因子的重要性次序的权重值，并根据权重对其进行重要性排序。权重值的计算有求和法、方根法以及特征向量法。我们用表2进行求和法举例，首先先将矩阵的每列进行标准化，然后将标准化后的各元素按行求和，最后将求和结果进行标准化从而得到各因子的权重值，图3表示了我们的计算过程。

为了检验判断矩阵的数值是否符合逻辑规范，我们需要进行一致性校验。我们需要求出最大特征根，然后用以下的一致性指标 CI 来检验判断的一致性指标，n为判断矩阵阶数：

CI=0 表示判断矩阵完全一致，CI越大，判断矩阵的不一致性程度越严重。然后我们根据CI、RI值求解CR值，判断其一致性是否通过。

RI的值要参考如下平均随机一致性指标表来确定，其值n即判断矩阵的阶数。

若 CR < 0.1则认为判断矩阵通过了一致性检验，若不满足条件则需要检查判断矩阵，并对其值进行调整。

我们以表2为例，n值为3，我们计算最大特征根，公式为：

AW为：判断矩阵*标准化后的权重，然后按行的累加值。根据以上几个公式计算可得到CR<0.1，因此通过了一致性检验。其他几个判断矩阵也可以用同样的方式求解，并进行一致性校验。

3.4 层次的总排序及一致性校验

由以上几步我们得到的是一组元素对其上一层中某元素的权重向量。我们最终要得到各元素尤其是最低层对于目标的排序权重，总排序权重要自上而下地将单准则下的权重进行合成。例如图1中将第二层“使用体验”的权重分别和第三层“硬件使用体验”的权重和“软件使用体验”的权重相乘，类似依次得到相对于目标的权重值，最终进行权重的排序。涉及最低层中各方案对层次总排序需作一致性检验，检验由高层到低层逐层进行即可。当总排序随机一致性比例CR<0.1 时，认为层次总排序结果具有较满意的一致性并接受该分析结果。

Part 04 相关用户体验设计测评的应用方向

从以上的分析可以看出，AHP(层次分析法)是一种多准则决策方法，它可用于帮助评估和比较不同因素的重要性。在用户体验设计测评中，AHP还可以应用于以下几个方面：

1)分配相关功能需求重要性：AHP可以帮助确定功能需求的相对重要性，确定产品设计中的重点关注地方，为产品或服务的设计提供一定指导。

2)帮助决策产品或设计方案：AHP可以帮助比较决策不同的产品或设计方案，通过找到影响设计或产品方案的准则，使用AHP来计算它们之间的相对权重，最终为决策者找出最优的产品或设计方案。

3)确定产品优先改进方向：通过应用AHP，可以对用户体验中的不同方面进行评估和排序，以确定最需要改进的领域。将用户体验分解为易用性、效率、满意度等多个维度，通过对这些维度进行比较和权重计算，帮助决策者确定在产品开发过程中优先改进方向。

4)评估用户的满意度：AHP还可以用于用户满意度的评估，将满意度分解为不同的影响因素，进行比较和权重计算，可以找出对用户满意度的影响最大的因素，以及对于提高用户满意度还有哪些需要改进的方面。

需要指出的是，在使用AHP进行用户体验测评时，在制定比较矩阵时要尽量客观、准确地进行比较，避免主观偏见对结果的影响，同时需要慎重选择评估者和数据源。总的来说，AHP为用户体验设计的提升提供了一种系统化和可量化的方法，有助于企业产品提供更满意的用户体验。

➺ 参考文献

[1] 叶珍. 基于AHP的模糊综合评价方法研究及应用[D].

[2] https://blog.csdn.net/weixin_43095238/article/details/108055579.

[3] https://zhuanlan.zhihu.com/p/448412538.