Video thumbnail

    程序员们关于现实的那些错误认知 - Lilly Ryan (PyCon AU 2025)

    Valuable insights

    1.现实无法被客观捕获: 核心问题在于现实本质上不可能被完全客观地捕获,但计算机系统必须依赖现实的表征,这导致了地图与领土的分离。

    2.原始数据是伪概念: 所有数据都是测量选择的结果,并非纯粹的原始信息。数据需要处理和消毒,以避免引入错误和不一致性。

    3.关注数据质量而非数量: 过度追求数据量而非质量会产生脆弱的系统。系统需要根据特定目的构建模型,而不是默认质量可以稍后挤出。

    4.警惕大型语言模型的误导: 大型语言模型(LLM)的营销常被夸大,用户需了解其本质是基于数学预测输出标记,而非进行客观思考或推理。

    5.许多重要概念无法衡量: 诸如正义、安全或爱等重要概念无法被量化。依赖代理指标可能导致人们忘记了它们并非真正衡量了核心事物。

    6.观察行为本身带有偏见: 观察者在选择测量对象和描述方式时,会无意识地带入自身的经验和信念,导致模型系统性地存在偏见。

    7.类别化是人工强加的结构: 现实本身没有内在结构;我们施加的类别和结构虽然有助于管理,但必然存在重叠和灰色地带。

    8.类别化可能导致压迫: 当类别被误认为是客观真理,并被用作控制世界的武器时,可能导致对人类知识和复杂性的抹除,引发压迫。

    9.抽象是工具而非世界的镜子: 抽象的目的是提供效用而非追求真理。系统设计应以实用性为导向,而非试图构建一个完美的现实副本。

    10.设计必须明确目的与约束: 每一个抽象都应从明确的构建目的开始。系统边界取决于讨论的目的,需要明确正在优化什么以及在何种条件下工作。

    介绍与核心观点:地图不是领土

    本次分享由信息安全工程师兼前历史学家Lily Ryan带来,主题聚焦于程序员关于现实的常见误解。演讲者指出,当前安全领域正处于一个快速迭代、频繁出错的周期中,许多产品和项目的失败源于核心人员错误地相信输入系统的数据是以某种客观方式存在的。这种信念假设计算机能够自然地处理现实世界的复杂性,因为人们错误地认为计算机是极其复杂的,而现实相对简单。然而,核心问题在于现实本身不可能被客观捕获,尽管工作需要用数据和模型来代表世界,以便进行观察和假设检验。

    映射世界的必要性

    “地图不是领土”这一常见格言,表达了处理计算任务时必须找到代表世界的方式。处理计算机相关工作,必然涉及与现实世界中某些片段的关联。因此,必须做出决策,将这些事物转化为数据集、模型和抽象系统,用以替代实际讨论的对象,从而帮助表示它们并检验关于该事物的假设。这些概念并非新鲜事物,其哲学和文学根源深远,但随着我们处理的数据片段日益复杂和细微,这一概念的重要性也随之增加。

    地图不是领土,这是我们工作中经常出现的、可引用的常见短语。

    谬误列表的意义

    本次演讲的标题是一种长期的列表形式,探讨表面看似简单、深入挖掘后却日益复杂的主题。演讲的目的不仅是告知已了解这些概念的听众,更是为所有选择观看的人提供工具,以便与生活中那些陷入“我们可以客观捕获现实”观念的人进行对话,并据此构建产品。由于现实是滑溜的,即便是听众自己或演讲者本人也可能在小事上遗忘这些基本原则。

    数据量与现实表征的谬误

    第一个思考陷阱是:拥有的数据越多,我们就能越完美地表征现实。虽然数据源的增加确实能提供更细致的视角,但最终结果仍是一堆现实切片的模型,上面覆盖着个人的解释。术语“原始数据”本身就是矛盾修饰法,因为它总是测量者选择的结果,包括测量什么、如何测量以及测量的意义。原始数据如同未经巴氏消毒的牛奶,充满了需要处理的“细菌”,以提高其质量以供消费。

    质量胜于数量

    真正带来差异的是高质量的数据源。当人们在规模化和持续增长的时代,默认质量可以稍后从模型中提炼出来,认为数据源的数量最重要时,系统会变得非常脆弱。许多人可能熟悉这种糟糕的体验,例如将二十年的SharePoint数据接入LLM试图解决信息查找问题,结果通常只是一阵刺耳的噪音,需要编写极其复杂的提示词来纠正。

    演讲者
    研究主题
    挑战
    Ishad Zaman
    计算小鼠大脑中的神经元数量
    处理生物学数据的复杂性
    Renee Noble
    学生点名簿匹配
    多轮方法仍无法100%准确匹配姓名
    Dave Cole
    电动汽车的实际路线规划
    需要考虑所有充电桩故障情况

    LLM的“闪光表情符号效应”

    许多AI产品公司对LLM的营销方式是这种谬误的绝佳例证。将LLM包装成多功能的“万能机器”,并用闪光表情符号按钮隐藏其复杂性,鼓励用户认为它只是魔法,无需思考。然而,用户需要了解其基本工作原理——数学上预测和输出基于输入标记的下一个标记,而不是像人类一样进行客观或中立的思考和推理。将互联网上所有书面数据视为人类知识的全部,忽略了对书面语言和早期数字访问的偏好。

    可衡量性与观察者的偏见

    另一个谬误是假设一切都是可衡量的,但这并非事实。如何衡量正义、安全或爱?这些重要事物无法被量化,人们必须使用代理指标来代表其他事物。安全专家可能发现,修补的漏洞数量并不一定意味着应用更安全,因为核心开发者的GitHub密码被钓鱼可能导致整个构建服务器被控制。我们选择观察或认为我们观察到的事物,决定了我们所见的世界,因为现实对每个人看起来都不同。

    观察的不可避免的偏见

    人们的观点、历史和感知能力(如色谱)塑造了他们对好与坏的判断,这些观点会不断变化。许多人倾向于认为存在一个被每个人共享的单一现实,这在某种程度上是一种防御机制,因为大脑持续意识到现实的主观性并不利于日常运作。认识到“我画画很差”只是视角和品味问题,虽然具有解放性,但却难以参与更广泛的功能系统,如购物或保持对话。

    我们经常陷入一种陷阱,认为每个人所经历的现实只有一个,因为这多少是一种防御机制。

    共识的必要性

    为了在合作层面完成任何事情,我们需要共识,因此我们不断地进行近似,这通常足够好用,例如网络标准。尽管技术上可以编写不推荐的Web应用代码,但其他系统可能不作相同假设,导致混乱。科学的基础也是如此:单个研究只是一个经验的表达,但通过足够多样的实验和广泛的讨论,可以接近科学共识,为进一步构建提供坚实基础。当负责解释现实片段的数据集或模型决策时,了解共享共识变得至关重要。

    类别化、共识与系统性影响

    现实没有内在结构;我们施加的任何结构都是人为强加的,尽管它们在选择菜单或超市布局时非常有用。然而,类别是强大的,但也带有塑造世界的权力。类别在最佳情况下是理解世界的方式,在最坏的情况下,它们会导致压迫和人权侵犯。当人们将类别误认为是客观真理,特别是当它们被用作武器来控制世界时,情况就会变得非常糟糕。

    类别化的危险性

    人类学家詹姆斯·C·斯科特在其著作《像国家一样看待世界》中深入探讨了政府和组织如何试图在规模上强加类别,目标是使世界变得清晰易读。为了管理资源分配或规划未来,使世界对政府或计算机清晰易读会扁平化并抹去局部知识和复杂性,这些复杂性在原有环境中可能发挥着重要作用,但在外部则被视为不重要而被丢弃。

    国家规划视角
    地方知识/生态视角
    系统性地用单一物种(如挪威云杉)的整齐行取代原始森林
    包含多样化动植物物种,支撑土壤健康和养分循环
    能够通过办公室表格精确预测产量和收入
    生态关系维持了土壤健康和病虫害抵抗力
    在最初80年产生统一、高质量的木材,效率极高
    当生态继承耗尽后,森林崩溃,产量暴跌

    迎合描述的自我重塑

    当强大的群体创造类别,并且存在强烈的激励去适应这些类别时,人们会开始重塑自身以匹配描述。例如,工业风、回收木材和极简家具构成了特定的美学,这种“Airspace”现象在世界各地出现,因为它们在Instagram等平台上拍照效果好,并被推荐算法所青睐。Spotify的流派类别也以类似方式运作,平台会根据播放列表的氛围生成音乐,并利用分析仪表板引导音乐家调整创作以适应这些类别,以增加曝光和收入。

    抽象的原则:工具而非镜子

    最后一个陷阱是认为完美地模拟现实是有用或可取的。这种思维方式会导致数据过度捕获、包含低质量数据、决策不佳以及系统僵化。对于开发人员而言,这可能导致项目瘫痪,因为试图设计一个能优雅处理所有潜在未来用例的系统,最终可能导致什么都做不出来。认识到我们正在为特定目的制作世界表征,反而具有解放作用。

    明确目标与约束

    抽象是工具,而非镜子;工具旨在有用,而非完美。正如比尔·肯特所言,效用与真理之间存在重要区别。在计算领域,如果工作没有任务可做,就应该反思其目的,将困难的部分留给艺术家。系统设计必须从明确的构建意图开始,明确需要它做什么。达娜·米多斯指出,世界是一个连续体,划分系统边界取决于讨论的目的和需要回答的问题。

    • 明确构建的初衷和需要实现的功能。
    • 明确约束条件:为谁解决什么问题?在什么条件下?优化目标是什么?
    • 为实际目的设计,而非为想象中的完美系统设计。

    抽象的后果

    承认我们处理的是现实的抽象,并不意味着这些抽象没有后果。我们对测量内容和命名方式的选择会对世界产生影响,涉及技术决策以及影响人们生活、机会和资源获取的决策。因此,设计工具时必须深思熟虑:谁能从中受益?谁可能被排斥或被误传?这种设计倾向于鼓励何种行为?最终目标是构建能够为特定目的有效运作、承认自身局限性并尊重用户的合理抽象。

    Useful links

    These links were generated based on the content of the video to help you deepen your knowledge about the topics discussed.

    This article was AI generated. It may contain errors and should be verified with the original source.
    VideoToWordsClarifyTube

    © 2025 ClarifyTube. All rights reserved.