文档即测试 —— doctest模块

张

张建站

2026/5/6 6:19:28

10分钟阅读

一、核心概念解析1.1 基础定义什么是“文档即测试”想象一下你在教朋友玩一个新桌游普通文档你写了一本规则书里面说“玩家每次可以抽2张牌”文档即测试你不仅写了规则还附加了一句“比如小张有3张牌抽2张后他现在有5张牌”而且这句话本身就是可执行的测试doctest模块做的就是这件事它扫描你的文档字符串docstring找出看起来像Python交互式会话的示例然后运行这些示例验证结果是否与文档中写的一致。核心思想文档中的示例应该是真实可运行的代码如果示例不能运行或结果不对说明文档过时了文档和代码永远同步因为不同步就会测试失败1.2 基本语法最简单的doctest# doctest_basic.pydefadd_numbers(a,b): 将两个数字相加。示例: add_numbers(2, 3) 5 add_numbers(-1, 1) 0 支持浮点数: add_numbers(1.5, 2.5) 4.0 returnabdefgreet(name,formalFalse): 根据形式返回问候语。基本用法: greet(Alice) Hello, Alice! 正式问候: greet(Bob, formalTrue) Good day, Mr. Bob. 注意空白字符也会被比较: greet(Charlie) # 这行只是注释不会被执行 Hello, Charlie! ifformal:returnfGood day, Mr.{name}.returnfHello,{name}!if__name____main__:# 运行这个文件中的所有doctestimportdoctest doctest.testmod(verboseTrue)# verboseTrue会显示详细信息运行这个脚本python doctest_basic.py你会看到类似这样的输出Trying: add_numbers(2, 3) Expecting: 5 ok Trying: add_numbers(-1, 1) Expecting: 0 ok ...doctest的语法规则开头的是要执行的代码下一行是期望的输出如果输出匹配测试通过空行用于分隔不同的测试用例以#开头的是注释不会被执行1.3 核心特点为什么使用doctest文档与代码同步示例过时测试会失败提醒你更新降低学习成本新开发者看文档就能知道函数怎么用轻量级测试简单的功能用doctest比写完整的单元测试更快捷代码即文档文档字符串本身就是可执行的示例库教育价值教别人用你的代码时文档中的示例都是验证过的二、应用场景详解2.1 为函数和类编写可测试文档# doctest_functions_classes.py 数学工具函数集合。这个模块提供了一些常用的数学计算函数。 defcalculate_discount(price,discount_rate): 计算打折后的价格。参数: price: 原价 discount_rate: 折扣率0.0到1.0之间返回: 折后价格示例: calculate_discount(100, 0.2) # 8折 80.0 calculate_discount(50, 0) # 不打折 50.0 calculate_discount(200, 0.5) # 5折 100.0 边界情况: calculate_discount(0, 0.3) # 0元商品 0.0 ifnot0discount_rate1:raiseValueError(折扣率必须在0到1之间)returnprice*(1-discount_rate)classBankAccount: 简单的银行账户类。示例: account BankAccount(Alice, 1000) account.balance 1000 account.deposit(500) 存入500元当前余额1500元 account.withdraw(300) 取出300元当前余额1200元 account.withdraw(2000) # 余额不足 Traceback (most recent call last): ... ValueError: 余额不足 def__init__(self,owner,initial_balance0):self.ownerowner self.balanceinitial_balancedefdeposit(self,amount):存款ifamount0:raiseValueError(存款金额必须大于0)self.balanceamountreturnf存入{amount}元当前余额{self.balance}元defwithdraw(self,amount):取款ifamount0:raiseValueError(取款金额必须大于0)ifamountself.balance:raiseValueError(余额不足)self.balance-amountreturnf取出{amount}元当前余额{self.balance}元def__str__(self):returnf{self.owner}的账户余额{self.balance}元defrun_doctests():运行这个模块的doctestimportdoctest# 安静模式只显示失败信息print(运行doctest测试...)resultdoctest.testmod(verboseFalse)ifresult.failed0:print(f✓ 所有{result.attempted}个测试通过)else:print(f✗{result.failed}个测试失败)if__name____main__:run_doctests()2.2 在模块级别编写文档测试不仅函数和类可以有doctest整个模块也可以在文档字符串中包含测试# math_utils.py 数学工具模块。这个模块提供一些常用的数学计算功能。模块级别的示例: from math_utils import is_prime, fibonacci is_prime(17) True is_prime(9) False fibonacci(6) # 斐波那契数列: 0,1,1,2,3,5,8,13... 8 fibonacci(10) 55 defis_prime(n):判断一个数是否为质数。ifn2:returnFalseforiinrange(2,int(n**0.5)1):ifn%i0:returnFalsereturnTruedeffibonacci(n):计算第n个斐波那契数。ifn0:raiseValueError(n必须是非负整数)a,b0,1for_inrange(n):a,bb,abreturna# 模块级别的测试用例不在任何函数内测试边缘情况: is_prime(1) False is_prime(2) # 2是质数 True fibonacci(0) 0 fibonacci(1) 1 if__name____main__:importdoctest doctest.testmod()2.3 最佳实践编写有效的doctest原则1示例应该简单明了# good_examples.pydefprocess_items(items): 处理项目列表。好的示例简单直接: process_items([1, 2, 3]) [2, 4, 6] 不好的示例太复杂: process_items([x for x in range(10) if x % 2 0]) [0, 4, 8, 12, 16] # 这个示例本身就需要理解失去了文档的意义 return[x*2forxinitems]deffind_max(numbers): 找到列表中的最大值。好的示例展示常见情况: find_max([3, 1, 4, 1, 5, 9]) 9 好的示例展示边缘情况: find_max([-5, -10, -1]) -1 好的示例展示错误处理: find_max([]) Traceback (most recent call last): ... ValueError: 列表不能为空 ifnotnumbers:raiseValueError(列表不能为空)returnmax(numbers)原则2使用ELLIPSIS选项处理可变输出# doctest_ellipsis.pyimportrandomimportdatetimedefget_current_info(): 获取当前信息。由于时间和随机性输出会变化我们可以用...匹配部分输出: info get_current_info() info[timestamp].year datetime.datetime.now().year True 0 info[random_number] 100 True info[status] ok return{timestamp:datetime.datetime.now(),random_number:random.randint(0,100),status:ok}defgenerate_id(): 生成随机ID。使用ELLIPSIS忽略变化的部分: generate_id() # doctest: ELLIPSIS ID-... 更精确的匹配: id_str generate_id() id_str.startswith(ID-) and len(id_str) 10 True importuuidreturnfID-{uuid.uuid4().hex[:6]}if__name____main__:importdoctest# 启用ELLIPSIS选项doctest.testmod(optionflagsdoctest.ELLIPSIS)原则3组织大型测试用例# doctest_organization.py 数据处理工具。这个模块包含多个相关的数据处理函数。 defnormalize_data(data): 标准化数据使所有值在0-1范围内。示例: normalize_data([1, 2, 3, 4, 5]) [0.0, 0.25, 0.5, 0.75, 1.0] normalize_data([10, 20]) [0.0, 1.0] ifnotdata:return[]min_valmin(data)max_valmax(data)ifmin_valmax_val:return[0.5]*len(data)return[(x-min_val)/(max_val-min_val)forxindata]deffilter_outliers(data,threshold2): 过滤掉离群值。基本用法: filter_outliers([1, 2, 3, 4, 100]) [1, 2, 3, 4] 自定义阈值: filter_outliers([1, 2, 3, 4, 10], threshold1.5) [1, 2, 3, 4] importstatisticsiflen(data)2:returndata mean_valstatistics.mean(data)stdev_valstatistics.stdev(data)return[xforxindataifmean_val-threshold*stdev_valxmean_valthreshold*stdev_val]# 为整个模块编写集成测试集成测试示例: data [1, 2, 3, 100, 4, 5] filtered filter_outliers(data) filtered [1, 2, 3, 4, 5] normalized normalize_data(filtered) normalized # doctest: ELLIPSIS [0.0, 0.25, 0.5, 0.75, 1.0] if__name____main__:importdoctest# 运行测试显示详细信息doctest.testmod(verboseTrue)三、高级技巧3.1 控制测试执行选项doctest提供了多种选项来控制测试行为# doctest_options.py 测试选项演示。这个模块展示如何使用不同的doctest选项。 defexample_with_output(): 有输出的函数示例。默认情况下doctest会精确比较输出: print(Hello\\nWorld) Hello World 使用NORMALIZE_WHITESPACE可以忽略空白差异: [a, b, c] # doctest: NORMALIZE_WHITESPACE [a, b, c] 注意上面列表的表示实际输出是[a, b, c]但空格可能不同 passdefexample_with_exceptions(): 异常处理示例。测试异常时我们通常只关心异常类型: 1 / 0 Traceback (most recent call last): ZeroDivisionError: division by zero 使用ELLIPSIS可以只匹配部分异常信息: int(not a number) # doctest: ELLIPSIS Traceback (most recent call last): ... ValueError: ... passdefexample_with_float(): 浮点数比较示例。浮点数比较有精度问题: 0.1 0.2 # 这实际上等于0.30000000000000004 0.30000000000000004 我们可以允许一定的误差: abs((0.1 0.2) - 0.3) 0.000001 True 或者使用approx函数: from math import isclose isclose(0.1 0.2, 0.3) True pass# 模块级别的选项设置全局设置选项: import doctest doctest.set_unittest_reportflags(doctest.REPORT_NDIFF) if__name____main__:importdoctest# 设置多个选项options(doctest.ELLIPSIS|# 允许使用...匹配任意输出doctest.NORMALIZE_WHITESPACE|# 忽略空白差异doctest.IGNORE_EXCEPTION_DETAIL# 忽略异常详情只检查类型)# 运行测试resultdoctest.testmod(optionflagsoptions,verboseTrue)print(f\n测试结果:{result.attempted}个测试尝试{result.failed}个失败)3.2 在测试文件中使用doctest除了在代码文件中嵌入doctest你还可以创建独立的测试文件# test_example.txt 这是独立的doctest文件。我们可以在这里写测试而不影响源代码文件。 from math_utils import is_prime is_prime(2) True is_prime(4) False is_prime(17) True from math_utils import fibonacci fibonacci(0) 0 fibonacci(1) 1 fibonacci(5) 5 fibonacci(10) 55 然后创建一个Python脚本来运行这个测试文件# run_doctest_file.py 运行独立的doctest文件。 importdoctestimportsysdeftest_text_file():测试文本文件中的doctestprint(测试独立的doctest文件...)# 运行文本文件中的测试resultdoctest.testfile(test_example.txt,optionflagsdoctest.ELLIPSIS,verboseTrue)returnresultdeftest_external_module():测试外部模块的doctestprint(\n测试外部模块的doctest...)# 假设我们有一个math_utils.py模块try:importmath_utils resultdoctest.testmod(math_utils,verboseFalse)print(fmath_utils测试:{result.attempted}尝试{result.failed}失败)exceptImportError:print(找不到math_utils模块跳过测试)if__name____main__:# 测试文本文件result1test_text_file()# 测试外部模块test_external_module()# 总结ifresult1.failed0:print(\n✓ 所有测试通过)else:print(f\n✗ 有{result1.failed}个测试失败)sys.exit(1)3.3 与unittest框架集成doctest可以与Python的标准单元测试框架unittest无缝集成# doctest_unittest_integration.py doctest与unittest集成示例。这个模块展示如何将doctest作为unittest的一部分运行。 defmultiply(a,b): 两个数相乘。示例: multiply(2, 3) 6 multiply(0, 100) 0 multiply(-5, 4) -20 returna*bdefdivide(a,b): 两个数相除。示例: divide(10, 2) 5.0 divide(5, 2) 2.5 除零错误: divide(10, 0) Traceback (most recent call last): ZeroDivisionError: division by zero returna/b# unittest测试类importunittestimportdoctestclassTestMathFunctions(unittest.TestCase):测试数学函数的单元测试deftest_multiply_basic(self):测试基本的乘法self.assertEqual(multiply(2,3),6)self.assertEqual(multiply(0,5),0)self.assertEqual(multiply(-3,4),-12)deftest_divide_basic(self):测试基本的除法self.assertEqual(divide(10,2),5.0)self.assertEqual(divide(9,3),3.0)deftest_divide_by_zero(self):测试除零错误withself.assertRaises(ZeroDivisionError):divide(10,0)defload_tests(loader,tests,ignore): 为unittest加载doctest。这个函数会被unittest自动调用将doctest添加到测试套件中。 # 添加当前模块的doctesttests.addTests(doctest.DocTestSuite())# 也可以添加其他模块的doctest# tests.addTests(doctest.DocTestSuite(other_module))returntestsif__name____main__:# 运行unittest会自动包含doctestunittest.main(verbosity2)四、实战案例为一个小型工具库编写文档测试让我们为一个简单的字符串处理库编写完整的文档测试# string_tools.py 字符串处理工具库。一个简单但实用的字符串处理函数集合。 defreverse_string(s): 反转字符串。示例: reverse_string(hello) olleh reverse_string(Python) nohtyP reverse_string() # 空字符串 reverse_string(a) # 单个字符 a returns[::-1]defis_palindrome(s,ignore_spacesFalse,ignore_caseFalse): 检查字符串是否是回文。参数: s: 要检查的字符串 ignore_spaces: 是否忽略空格 ignore_case: 是否忽略大小写返回: 如果是回文返回True否则返回False 示例: is_palindrome(racecar) True is_palindrome(hello) False is_palindrome(A man a plan a canal Panama) False is_palindrome(A man a plan a canal Panama, ignore_spacesTrue, ignore_caseTrue) True is_palindrome(Was it a car or a cat I saw, ignore_spacesTrue, ignore_caseTrue) True ifignore_spaces:s.join(s.split())ifignore_case:ss.lower()returnss[::-1]defcount_vowels(s,include_yFalse): 统计字符串中的元音字母数量。参数: s: 字符串 include_y: 是否将y视为元音返回: 元音字母的数量示例: count_vowels(hello) 2 count_vowels(python) 1 count_vowels(rhythm) 0 count_vowels(rhythm, include_yTrue) 1 count_vowels(Hello World!) 3 vowelsaeiouAEIOUifinclude_y:vowelsyYreturnsum(1forcharinsifcharinvowels)defslugify(text,separator-): 将文本转换为URL友好的slug格式。参数: text: 原始文本 separator: 单词分隔符返回: slug格式的字符串示例: slugify(Hello World!) hello-world slugify(Python 3.9 Release Notes) python-3-9-release-notes slugify(Data Science 101: Introduction, separator_) data_science_101_introduction slugify( Multiple Spaces Here ) multiple-spaces-here slugify(SpecialChars#Removed!) specialcharsremoved importre# 转换为小写texttext.lower()# 移除非字母数字字符用空格替换textre.sub(r[^a-z0-9], ,text)# 移除首尾空格texttext.strip()# 用分隔符替换空格textre.sub(r\s,separator,text)returntext# 模块级别的综合测试综合测试示例: 测试字符串反转: reverse_string(Python is awesome) emosewa si nohtyP 测试回文检测: test_cases [ ... (racecar, True), ... (hello, False), ... (A man a plan a canal Panama, False), ... ] all(is_palindrome(s) expected for s, expected in test_cases) True 测试元音计数: count_vowels(The quick brown fox jumps over the lazy dog) 11 测试slug生成: slugify(Testing 1, 2, 3!) testing-1-2-3 if__name____main__:importdoctestprint(*50)print(运行字符串工具库的doctest)print(*50)# 运行测试resultdoctest.testmod(verboseTrue)print(*50)ifresult.failed0:print(f✅ 所有{result.attempted}个测试通过)else:print(f❌{result.failed}个测试失败)运行这个脚本你会看到详细的测试输出包括每个测试用例的执行情况。五、注意事项5.1 使用限制不适合复杂测试doctest适合简单的示例验证不适合复杂的测试逻辑输出必须精确默认情况下输出必须完全匹配包括空格和换行有副作用示例代码会实际执行可能有副作用性能考虑文档中的示例每次运行测试都会执行可读性过多的测试示例可能影响文档的可读性5.2 常见问题Q: doctest和unittest哪个更好A: 不是更好而是用途不同doctest用于验证文档中的示例确保文档正确unittest用于编写全面的测试套件包括各种边界情况Q: 如何处理随机输出或变化输出A: 使用ELLIPSIS选项或者用条件判断而不是精确匹配importrandomrandom.randint(1,100)# doctest: ELLIPSIS...Q: doctest能测试私有函数吗A: 可以但不建议。文档测试应该关注公共API。Q: 测试失败时如何调试A: 使用doctest.testmod(verboseTrue)查看详细输出或者用pdb调试失败的测试。Q: 如何在CI/CD中运行doctestA: 在测试命令中添加python -m doctest your_module.py或者通过unittest运行。5.3 替代方案unittest/pytest需要全面的测试覆盖时文档生成工具Sphinx的autodoc扩展可以自动生成API文档示例代码库维护独立的使用示例库交互式教程Jupyter Notebook作为交互式文档类型提示配合mypy进行静态类型检查何时选择替代方案需要测试覆盖率报告 → 使用pytest大型项目需要完整测试套件 → 使用unittest需要生成HTML文档 → 使用Sphinx需要交互式教学 → 使用Jupyter Notebook需要静态类型检查 → 使用mypy 类型提示六、总结通过本文的学习你应该已经掌握了✅doctest基础如何在文档字符串中编写可执行示例✅语法规则和期望输出的格式✅测试选项ELLIPSIS、NORMALIZE_WHITESPACE等高级选项✅集成测试如何与unittest框架集成✅最佳实践编写清晰、有用的文档测试doctest的核心价值文档可靠性确保文档中的示例永远正确开发效率写文档的同时就完成了测试学习友好新开发者通过文档就能理解代码用法代码质量鼓励开发者提供完整、可运行的示例维护便利API变化时过时的文档会自动测试失败使用建议从简单开始先为关键函数添加几个基本示例关注公共API优先为重要的、公开的函数编写文档测试保持简洁每个示例应该简单明了突出重点定期运行将doctest集成到你的开发流程中适度使用不是所有函数都需要文档测试找到平衡点你在项目中用过doctest吗有什么有趣的经验或教训或者你认为文档测试在实际项目中到底有多大价值欢迎在评论区分享你的看法和经验

“深入”是能力，“浅出”是慈悲。

你说得非常有洞察力，而且这其实触及了一个教育和认知科学中的经典问题：“知识的诅咒”（Curse of Knowledge）。🧠 什么是“知识的诅咒”？这是指：一旦你掌握了某个知识，就很难想象“不…...

2026/5/6 6:16:15 阅读更多 →

Codex Eternal：多智能体记忆操作的安全框架与四步工作流解析

1. 项目概述：Codex Eternal 是什么？如果你在多智能体协作环境（比如 OpenClaw 或 KiloCode）里折腾过，肯定遇到过“记忆”这个老大难问题。我说的不是简单的聊天记录，而是那种结构化的、可追溯的、能安全操作…...

2026/5/6 6:07:46 阅读更多 →

从本地开发到团队协作：用CLion + Gitee管理你的C++库项目（含CMakeLists最佳实践）

从本地开发到团队协作：用CLion Gitee管理你的C库项目（含CMakeLists最佳实践） 在C开发中，动态链接库（DLL）是代码复用和模块化设计的核心工具。但很多开发者止步于"能跑通"的demo阶段，…...

2026/5/6 6:06:44 阅读更多 →

Autovisor：终极自动化学习助手 - 5分钟快速上手智慧树刷课教程

Autovisor：终极自动化学习助手 - 5分钟快速上手智慧树刷课教程【免费下载链接】Autovisor 2025智慧树刷课脚本基于Python Playwright的自动化程序 [有免安装版] 项目地址: https://gitcode.com/gh_mirrors/au/Autovisor 你是否厌倦了每天手动点击播放、等待…...

2026/5/5 12:09:26 阅读更多 →

ModelScope Auto Proxy：智能路由网关，零成本统一调用免费大模型API

1. 项目概述与核心价值如果你和我一样，是个重度依赖 AI 编程工具（比如 Cursor、Cline）的开发者，那你肯定对 OpenAI 的 API 调用成本又爱又恨。爱的是它强大的能力，恨的是账单上的数字。最近，国内的开源社…...

2026/5/5 13:13:36 阅读更多 →

从零到一：手把手教你用BetaFlight CLI命令配置AOCODARC H7DUAL飞控板（保姆级教程）

从零到一：手把手教你用BetaFlight CLI命令配置AOCODARC H7DUAL飞控板（保姆级教程） 当你第一次拿到AOCODARC H7DUAL这块飞控板时，可能会被密密麻麻的引脚和复杂的配置选项吓到。别担心，这篇教程将带你从零开始&#xff…...

2026/5/5 3:26:31 阅读更多 →

League Akari：你的英雄联盟游戏体验进化指南

League Akari：你的英雄联盟游戏体验进化指南【免费下载链接】League-Toolkit An all-in-one toolkit for LeagueClient. Gathering power 🚀. 项目地址: https://gitcode.com/gh_mirrors/le/League-Toolkit 想象一下这样的场景：你正在…...

2026/5/5 9:51:58 阅读更多 →