AI 重要概念
autoencoder自动编码器是一种神经结构,它学习未标记数据的压缩表示,由编码器(将数据映射到表示)和解码器(从表示中重建数据)组成。
Data augmentation数据扩充是一种通过从现有数据样本中创建新数据样本来增强模型健壮性和泛化性的策略。这个过程可以包括替换序列中的记号,改变图像的视觉方面,或改变原子位置,始终保留基本信息。这种技术不仅增加了数据的多样性,而且增加了数据量,从而有助于模型的训练。
Distribution shift人工智能方法应用中的一个普遍问题,即算法最初训练的underlying data分布不同于它在实现过程中遇到的数据分布。
End-to-end learning端到端学习使用可微分组件,如神经网络模块,直接将原始输入连接到输出,避免了手工制作输入特征的需要,并允许从输入直接生成预测。
Generative models生成模型估计underlying data的概率分布,然后可以从该分布中生成新的样本。例子包括变分自编码器、生成对抗网络、normalizing flows、扩散模型和生成预训练变压器。
Geometric deep learning几何深度学习是机器学习的一个领域,它处理几何数据,如图形或流形。它通常保留几何数据在变换下的不变性,可以应用于3D结构。
Weakly supervised learning弱监督学习利用不完善、部分或嘈杂的监督形式,如有偏见或不精确的标签,来训练人工智能模型。
inverse problem逆问题是一种科学或数学挑战,其目标是decipher导致特定观察或数据集的潜在原因或参数。逆问题不是从原因到结果的直接预测,而是在相反的方向上运作,试图从结果观察中推断出原始条件。由于非唯一性和不稳定性,这些问题通常很复杂,其中多组原因可能导致类似的结果,数据的微小变化可能会极大地改变逆问题的解。
Physics-informed AI基于物理的人工智能是指将物理定律作为一种先验知识形式纳入人工智能模型的技术。利用深度学习模型强大计算能力求解基于PDE的物理系统,基于PDE的物理系统是对现实世界的近似,如圆柱绕流问题满足流体方程,求解流体方程能够更好理解圆柱在流场中的物理状态,之类的还有力学方程等等。这里主要总结了近几年来,基于数据和基于物理深度学习常用模型。