首测！GPT-4o做Code Review可行吗？原创

51CTO技术栈

发布于 2024-5-24 15:06

浏览

0收藏

编辑 | 言征

出品 | 51CTO技术栈（微信号：blog51cto）

近日，OpenAI一记重拳，推出了GPT-4o（“o”表示“omni”），将语音识别和对话方面的优势展示的淋漓尽致。几乎可以肯定，它也是一个更强的LLM。但它能进行代码审查吗？本文通过一些测试来寻找答案。

1.长乘法：交给计算机就可以

首先，我检查了它是否可以进行long乘法运算：

首测！GPT-4o做Code Review可行吗？-AI.x社区图片

答案是正确的，通过在线计算器上可以确认。但请注意，它并没有试图“计算出”结果——它只是将问题甩给了计算器。末尾的“查看分析”的蓝色图标基本上说明了这一点。这在之前的模型上都没有做到。

2.代码审查

我个人对正式严谨的代码审查没有兴趣。是的，有时初级开发人员可能确实需要这样的审查，但单元测试和配对编程通常足以消除不良的编程习惯。但是，几句含糊的评论可以帮助指出代码中的潜在小问题，而不会显得对容易重写的代码片段强加某种权威性的命令。

简而言之，代码审查更多的是一种social互动，而不是其他任何东西。请专注于工程问题，而不是代码的语义细节。

然而，代码审查是开发人员使用大型语言模型（LLM）的一个好案例。在这里，我将查看三段不同的代码，每段代码都只是绘制一个带有对角线的矩形框。我将添加问题，并查看GPT-4o（通过ChatGPT）如何对它们进行审查。

接下来，我们从简单的C#对角线绘制程序开始：

复制

using System;
 
public class Program
{
  public static void Main()
  {
    BoxWithDiagonalLine(5);
    BoxWithDiagonalLine(6,1);
    BoxWithDiagonalLine(6,-1);
    BoxWithDiagonalLine(2);
    BoxWithDiagonalLine(-1);
  }
 
  // Example 1
  public static void BoxWithDiagonalLine(int boxsize, int linepos = 0)
  {
    for(int i=0; i < boxsize; i++)
    {
      for (int j = 0; j < boxsize; j++)
      {
        if (j == linepos) Console.Write("x ");
        else Console.Write("o ");
      }
      linepos++;
      Console.Write("n");
    }
    Console.Write("n");
  }
}

将这个代码丢进https://dotnetfiddle.net/（不过请将编译器设置为至少.NET 6）并查看响应：

首测！GPT-4o做Code Review可行吗？-AI.x社区图片

这段代码相当简单，也相对容易理解。外部循环控制行，内部循环在正确的位置放置“x”。变量命名很简洁，代码很短。该方法有一个默认值，用于生成从左上角到右下角的完整对角线。虽然我们可以将起始线位置向左或向右移动，但拥有负的盒子大小（boxsize）并没有多大意义。因此，我们可以通过将方法参数更改为无符号整数（unsigned int）来改进它。这将立即阻止上一个示例甚至无法编译。一个非常大的linepos（起始线位置）将不可见，但它并不危险。

到目前为止，没有什么可评论的。

接下来，将for循环替换成while循环：

复制

// Example 2
public static void BoxWithDiagonalLine(int boxsize, int linepos = 0)
{
  int i = 0;
  while(i++ < boxsize)
  {
    int j = 0;
    while (j++ < boxsize)
    {
      if (j == linepos + 1) Console.Write("x ");
        else Console.Write("o ");
    } linepos++;
    Console.Write("n");
  }
  Console.Write("n");
}

现在这段代码可以运行，但值得稍微皱一下眉头。通过在后置递增循环变量（在i和j后面的++意味着值首先被读取，然后再增加1）我们节省了一些空间，但我们需要那个笨拙的linepos + 1表达式。

while循环不如for循环那样明确地表达开始和结束状态——但我们并没有陷入任何疯狂的状态。

我们进行最后一次更改。这次代码中有一个变量来“捣乱”，它试图使用linepos来控制外部循环：

复制

//Example 3
public static void BoxWithDiagonalLine(int boxsize, int linepos = 0)
{
  while(linepos < boxsize)
  {
    int j = 0;
    while (j++ < boxsize)
    {
      if (j == linepos + 1) Console.Write("x ");
        else Console.Write("o ");
    }
    linepos++;
    Console.Write("n");
  }
  Console.Write("n");
}

在试图不必要地移除一个循环变量的过程中，矩形框本身将不再完整——尽管使用默认值时可以工作。事实上，这解决了另一个问题，即总是在底部角落可靠地以一个“×”结束。

首测！GPT-4o做Code Review可行吗？-AI.x社区图片

这段糟糕的代码可能是因为开发者不当地继续使用了while循环。

现在让我们总结一下我们如何看待这些不同版本：

第一个例子是可行的，但我们可以强制参数为正数。然而，没有注释的话，这段代码的功能并不十分清晰。

第二个例子使用了while循环，它不像for循环那样具有确定性。同时，由于后置递增，还需要考虑一个丑陋的表达式。

第三个例子完全是错误的，尽管在默认情况下它得到了正确的结果。

我们对AI代码审查有什么期望？首先，我没有给出任何注释，那么它能否弄清楚这段代码的作用？只有方法的名称揭示了这一点。

这是GPT-4o的回应：

复制

“Your code is functional and effectively generates a box with diagonal lines based on the provided parameters. However, there are a few improvements and edge cases to consider:
1.Input Validation: Ensure that the box size is positive and greater than 1, since a box with a size less than 2 doesn’t make much sense.
2.Handling linepos: Improve handling of diagonal positions to ensure the diagonals are correctly drawn when linepos is negative or greater than the box size.
3.Code Readability: Add comments and improve variable naming for better readability and maintenance.”

【译】“您的代码是功能性的，并且能够有效地根据提供的参数生成带有对角线的矩形框。但是，有几个改进点和边缘情况需要考虑：

1.输入验证：确保矩形框的大小是正数且大于1，因为大小小于2的矩形框并没有太大意义。

2.处理linepos：改进对角线位置的处理，以确保当linepos为负数或大于矩形框大小时，对角线能够正确绘制。

3.代码可读性：添加注释并改进变量命名以提高代码的可读性和可维护性。”

所以它确实理解了代码的作用——即使它认为程序画的是“lines”而不是“line”。这仍然很好。

它建议的代码如下：

复制

// ChatGPT4o suggested code
public static void BoxWithDiagonalLine(int boxSize, int linePos = 0)
{
  if (boxSize < 2)
  {
    Console.WriteLine("Box size must be greater than 1.");
    return;
  }
 
  // Adjust linePos if it's out of the box boundaries
  if (linePos < 0) linePos = 0;
  if (linePos >= boxSize) linePos = boxSize - 1;
  for (int i = 0; i < boxSize; i++)
  {
    for (int j = 0; j < boxSize; j++)
    {
      if (j == linePos) Console.Write("x ");
        else Console.Write("o ");
    }
    linePos++;
 
    // Reset linePos if it goes out of the box boundaries
    if (linePos >= boxSize) linePos = 0;
    Console.Write("n");
}
Console.Write("n");

以下是将其放入dotnetfiddle.net的结果：

首测！GPT-4o做Code Review可行吗？-AI.x社区图片

我认为大多数人都会对小于2的boxSize感到满意。同时，它也很好地使用了驼峰命名法来命名参数，这在C#中是正确的。但遗憾的是，它忽略了改变位置以使线条从更低处开始的想法。而由于重置了linepos，我们在第二个例子的底部得到了那个糟糕的错误。

不过，从代码审查的角度来看，它确实抓住了要点。

3.第二个例子结果

让我们给它输入第二个例子，看看它的表现如何。下面是一些有趣的评论：

“The use of while loops is functional but could be less intuitive compared to for loops for such iterations.”

Excellent. This is exactly the right note.

“The condition j == linepos + 1 is used to determine where to place “x”. This works but can be made more intuitive by aligning with the index i.”

再次强调，这是很好的。它理解了功能性和可读性之间的区别。

生成的代码限制了linepos的值，并且相当奇怪地使用了取模函数来改变这个值。但最终得到了相同的结果。它回归到了for循环，这是很棒的。

4.第三个例子结果

最后，让我们给出糟糕的例子3，看看它的表现如何。奇怪的是，它没有发现这个错误，但提出了以下建议：

“Edge Cases:
– When linepos is negative, it works but may not be intended.”

这表明它完全没有理解代码——当然，我也没有明确说明我在做什么。所以，也许“wrapping line ”可能是一个合理的猜测？

5.结论

总的来说，审查的性质和结果给我留下了深刻的印象。GPT-4o生成的代码虽然不太理想，但也还可以。在对代码的批评中，没有“书呆子的笨拙脚步”；相反，它轻轻地引导读者走向更好的方向。

结果可能没有达到预期——态度很好但代码略有不准确。然而，新手应该会很喜欢；在这方面，它至少比部分人做得更好。

参考链接：https://thenewstack.io/reviewing-code-with-gpt-4o-openais-new-omni-llm/

本文转载自51CTO技术栈，作者：言征

标签

GPT-4o

OpenAI

代码

51CTO

51CTO博客

51CTO学堂

首测！GPT-4o做Code Review可行吗？原创

1.长乘法：交给计算机就可以

2.代码审查

3.第二个例子结果

4.第三个例子结果

5.结论

目录

51CTO

51CTO博客

51CTO学堂

首测！GPT-4o做Code Review可行吗？ 原创

1.长乘法：交给计算机就可以

2.代码审查

3.第二个例子结果

4.第三个例子结果

5.结论

目录

首测！GPT-4o做Code Review可行吗？原创