CrossCat 贝叶斯方法分析高维数据表。CrossCat估计整个联合分布表中变量的数据,通过近似推理层次结构、非参数贝叶斯模型, 并提供有效的采样条件分布。CrossCat结合非参数混合模型和贝叶斯网络结构学习的优势:它可以任何联合分布给予足够的数据模型假定潜在变量,但也发 现可观察到的变量之间的独立性。
一系列的探索性分析和预测建模任务可以通 过CrossCat解决,包括检测预测变量之间的关系,发现多个重叠clusterings,改动缺失值,同时选择特性和分类的行。CrossCat研究 表明,适用于分析实际表的1000万个细胞,包括医院成本和质量措施,投票记录,手写的数字,和国家级失业时间序列。