小编典典

Haskell 中的大规模设计?

all

什么是设计/构造大型功能程序的好方法,尤其是在 Haskell 中?

我已经阅读了很多教程(Write Yourself a Scheme 是我最喜欢的,Real World Haskell
紧随其后)——但大多数程序都相对较小,而且用途单一。此外,我不认为其中一些特别优雅(例如,WYAS 中的大量查找表)。

我现在想编写更大的程序,有更多的移动部分——从各种不同的来源获取数据,清理它,以各种方式处理它,在用户界面中显示它,持久化它,通过网络通信等等。怎么可能一种最好的代码结构是清晰、可维护和适应不断变化的需求?

对于大型面向对象的命令式程序,有相当多的文献解决了这些问题。MVC、设计模式等想法是实现诸如关注点分离和面向对象风格中的可重用性等广泛目标的不错的处方。此外,较新的命令式语言适用于“随成长而设计”的重构风格,在我的新手看来,Haskell
似乎不太适合这种风格。

是否有与 Haskell 相当的文献?函数式编程(单子,箭头,应用程序等)中可用的奇异控制结构的动物园如何最好地用于此目的?您可以推荐哪些最佳实践?

谢谢!

编辑(这是唐斯图尔特回答的后续行动):

@dons 提到:“Monads 以类型捕获关键架构设计。”

我想我的问题是:一个人应该如何用一种纯函数式语言来思考关键的架构设计?

考虑几个数据流和几个处理步骤的例子。我可以将数据流的模块化解析器编写为一组数据结构,并且可以将每个处理步骤实现为纯函数。一条数据所需的处理步骤将取决于其价值和其他数据。某些步骤之后应该有一些副作用,例如
GUI 更新或数据库查询。

以一种很好的方式将数据和解析步骤联系起来的“正确”方法是什么?可以编写一个大函数来为各种数据类型做正确的事情。或者可以使用 monad
来跟踪到目前为止已处理的内容,并让每个处理步骤从 monad 状态中获取下一步需要的任何内容。或者可以编写大部分独立的程序并发送消息(我不太喜欢这个选项)。

他链接的幻灯片有一个“我们需要的东西”项目符号:“将设计映射到类型/函数/类/单子的惯用语”。有哪些成语?:)


阅读 112

收藏
2022-03-08

共1个答案

小编典典

在 Haskell 的 Engineering Large
Projects

XMonad
的设计和实现中谈到了这一点。大工程是关于管理复杂性的。Haskell 中用于管理复杂性的主要代码结构机制是:

类型系统

  • 使用类型系统来强制抽象,简化交互。
  • 通过类型强制执行键不变量
    • (例如,某些值不能逃脱某些范围)
    • 那个特定的代码不做IO,不接触磁盘
  • 强制安全:检查异常(可能/要么),避免混淆概念(字、整数、地址)
  • 良好的数据结构(如 zippers)可以使某些类别的测试变得不必要,因为它们可以静态排除例如越界错误。

分析器

  • 提供程序堆和时间配置文件的客观证据。
  • 特别是堆分析是确保没有不必要的内存使用的最佳方法。

纯度

  • 通过删除状态显着降低复杂性。纯功能代码可扩展,因为它是组合的。您所需要的只是确定如何使用某些代码的类型——当您更改程序的其他部分时,它不会神秘地中断。
  • 使用大量“模型/视图/控制器”风格的编程:尽快将外部数据解析为纯函数式数据结构,对这些结构进行操作,然后在所有工作完成后,渲染/刷新/序列化。保持大部分代码纯净

测试

  • QuickCheck + Haskell 代码覆盖率,以确保您正在测试您无法使用类型检查的内容。
  • GHC + RTS 非常适合查看您是否在 GC 上花费了太多时间。
  • QuickCheck 还可以帮助您为模块识别干净、正交的 API。如果您的代码的属性难以说明,它们可能太复杂了。继续重构,直到你有一组干净的属性可以测试你的代码,并且组合得很好。那么代码可能也设计得很好。

用于结构化的单子

  • Monads 以类型捕获关键架构设计(此代码访问硬件,此代码是单用户会话等)
  • 例如,xmonad 中的 X monad 精确地捕获了系统的哪些组件可以看到哪些状态的设计。

类型类和存在类型

  • 使用类型类提供抽象:将实现隐藏在多态接口后面。

并发和并行

  • 潜入par您的程序,以简单、可组合的并行性击败竞争对手。

重构

  • 您可以在 Haskell 中 进行很多 重构。如果您明智地使用类型,这些类型可确保您的大规模更改是安全的。这将有助于您的代码库扩展。确保您的重构将导致类型错误,直到完成。

明智地使用 FFI

  • FFI 使使用外来代码更容易,但外来代码可能很危险。
  • 在假设返回数据的形状时要非常小心。

元编程

  • 一些模板 Haskell 或泛型可以删除样板。

包装和分销

  • 使用阴谋集团。不要滚动你自己的构建系统。 (编辑:实际上您现在可能想使用 Stack来开始使用。)。
  • 使用 Haddock 获取优秀的 API 文档
  • graphmod这样的工具可以显示你的模块结构。
  • 尽可能依赖 Haskell 平台版本的库和工具。这是一个稳定的基础。 (编辑:同样,这些天您可能希望使用 Stack来获得稳定的基础并运行。)

警告

  • 用于-Wall保持您的代码没有异味。您还可以查看 Agda、Isabelle 或 Catch 以获得更多保证。对于类似 lint 的检查,请参阅伟大的hlint,它将提出改进建议。

使用所有这些工具,您可以控制复杂性,尽可能多地消除组件之间的交互。理想情况下,你有一个非常大的纯代码库,这很容易维护,因为它是组合的。这并不总是可能的,但值得瞄准。

一般来说:将系统的逻辑单元 分解 成最小的引用透明组件,然后在模块中实现它们。组件集(或内部组件)的全局或本地环境可能会映射到
monad。使用代数数据类型来描述核心数据结构。广泛分享这些定义。

2022-03-08