Wolfram 语言中的静态分析工具

墨光科技

2022年11月2日 12:18

捕捉常见的问题

寻找错误并修复它们不仅仅是我的一种激情，更是一种强迫症。几年前，作为一名QA(质量检测）开发人员，我为 Wolfram 语言创建了 MUnit 单元测试框架，这是一个用于编写和运行语言单元测试的框架。从那时起，我创造了更多的工具来帮助开发人员编写更好的 Wolfram 语言代码，同时在这个过程中检查出错误。

编写好的测试需要大量的知识和大量的时间。由于我们需要能够尽快测试和解决问题，以便按期发布新功能，我们转向静态分析，以便能够做到这一点。

Wolfram 语言中的静态分析工具的图1

什么是静态分析

静态分析是在运行源代码之前对其进行检查的过程，以试图预测其行为并发现问题。作为一种测试方法，它是非常有用的。在代码运行时发现问题并不总是可行的。运行代码的成本也很高--如果代码失败了，那就更是如此。

考虑到构成 Wolfram 语言的大量代码（有120万行的内核启动 Wolfram 语言代码，横跨1900个文件，还有85万行的程序包 Wolfram 语言代码，横跨3700个文件），必须要有一个策略来测试所有这些代码的错误。Wolfram 公司对 Wolfram 语言的每一个角落都有专门的测试（其中有些是我写的!）

CodeInspector paclet 是那些重要的静态分析工具之一，它使开发人员能够完成更好的工作。CodeInspector 包含在最近发布的 Mathematica 12.2中，它可以扫描 Wolfram 语言代码并报告问题，而不需要用户手动运行 paclet。CodeInspector 与 CodeParser 和 CodeFormatter 一起构成 CodeTools 套件，供内部和外部用户使用，以提高其 Wolfram Language 代码的质量。

一般来说，静态分析不能发现程序中所有可能的 bug (这是通过 Rice 定理对停止问题的不可控性所产生的结果)。但是，静态分析仍然可以提供大量的重要信息

例如，很容易看出这里的测试中不需要 &&True。

Wolfram 语言中的静态分析工具的图2

这可能是遗留的调试代码，或者仅仅是逻辑上的一个错误。静态分析工具可能会警告说，&& True 不需要，可以去掉或改成别的东西。虽然静态分析工具不能辨别作者的意图，但它们可以找到值得调查的 "可能的问题 "的类别。

创建一个静态分析工具来测试 Wolfram 语言中的错误，有一系列非常具体的挑战。作为一种编码语言，Wolfram 语言具有难以置信的动态和灵活性。虽然这通常被认为是对开发人员的一种奖励，但它确实使抽象建模非常困难。函数可以在运行时被重新定义，而且在 Wolfram语言中精确定义一个值的概念也很复杂。

鉴于语言本身的局限性，CodeInspector 基于语法树的模式匹配进行轻量级静态分析。这类似于其他语言的 "提示工具"。事实上，CodeInspector paclet 的原名是 Lint! 但很快就发现，它所做的工作不仅仅是检查，所以它被改名为 CodeInspector）。)

CodeInspector 目前有大约两百条内置规则，可以应用于被检查的代码。这些规则从常见的语法问题（如缺少逗号）到更隐蔽的问题（如在符号求解器中使用 Q 函数）。许多规则包括修复代码的建议。

使用CodeInspector

CodeInspector 包含在 Mathematica 12.2 中。如果您使用的是旧版本的 Mathematica，您可以通过运行以下内容获得 CodeInspector：

Wolfram 语言中的静态分析工具的图3

为了以编程方式获得以下代码片断中所有问题的列表：

Wolfram 语言中的静态分析工具的图4

...您可以运行这个测试：

Wolfram 语言中的静态分析工具的图5

要获得测试中发现的所有问题的可视化摘要，请使用 CodeInspectSummarize（包含在 CodeInspector paclet 中）：

Wolfram 语言中的静态分析工具的图6

您甚至可以在命令行上使用 CodeInspectSummarize：

Wolfram 语言中的静态分析工具的图7

有多种方法可以控制 CodeInspectSummarize 的输出。为了做到这一点，我们需要对问题进行分类，这本身就是一个有趣的问题！这是因为我们需要在以可查询的方式公开问题的许多属性与建立一个易于人类使用的系统之间取得适当的平衡。这是因为我们需要在以可查询的方式暴露问题的许多属性与拥有一个易于人类消费和理解的系统之间取得适当的平衡。

我使用两个维度，至少现在是这样：严重程度和信心等级。如果输出显示有问题，严重性表示每个问题有多严重。这个问题会不会影响到用户？它是否会意外地发射核弹头？知识就是力量，特别是当您需要了解手头问题的影响时。

ConfidenceLevel表示该问题实际上是一个问题而不是一个假阳性的置信度。ConfidenceLevel 是一个介于 0.0 和 1.0 之间的真实值。ConfidenceLevel →0.0 意味着对所报告的问题完全没有信心，而 ConfidenceLevel →1.0 意味着眼前肯定有问题，比如函数中不匹配的括号。ConfidenceLevel 为 0.5 意味着大约有一半的时间出现这种问题，是一个假阳性。在括号不匹配的情况下，ConfidenceLevel 是1.0。CodeInspector 中更多的实验性规则会有更低的 ConfidenceLevel，当我添加启发式方法来消除假阳性时，我会增加问题的 ConfidenceLevel。为我的目的重新使用 ConfidenceLevel 符号可能是对符号的滥用，但它很方便。

因为 Wolfram 语言是如此的动态，很难判断一个所谓的 bug 实际上是一个错误。即使在前面的示例中，If 语句也可能是故意编写的。仅语法错误,例如：

Wolfram 语言中的静态分析工具的图8