📢 Infinite Nature:谷歌AI新进展,将静态照片生成飞越视角的 3D 动图

https://ai.googleblog/2022/11/infinite-nature-generating-3d.html

骑行博主“徐云流浪世界”最近大火,视频发布后经常几万人在线观看。盖着皑皑白雪的山峰、一望无际的沙漠公路、蜿蜒的山间溪流,随着他的骑行镜头在我们眼前驰骋而过。

那在家的我们,可以拥有云流兄同款镜头,像鸟儿一样俯瞰自然界美景吗?当然可以的!谷歌近期一项 Infinite Nature 研究表明,计算机可以通过视频和照片来学习生成这样丰富的 3D 体验

谷歌的科学家在 这篇文章 中详细介绍了原理与训练过程,相关论文已在 ECCV 2022上发表,给技术发展带来了前所未有的突破。数据表明,InfiniteNature-Zero 训练系统可以使用静态照片训练系统,从单个种子图像开始生成高分辨率、高质量的 3D 飞行动图

工具&框架

🚧 『CodeGeeX』清华大学开源·代码翻译与代码生成工具

https://github/THUDM/CodeGeeX

推特的裁员消息甚嚣尘上。斯克马别出心裁,带来几十名特斯拉工程师审核推特代码。要知道,特斯拉的主要使用Python,而推特是包含Scala、Java和Go等多种语言的混合体。如果工程师们早知道这个 CodeGeeX 代码翻译工具,就不会给出按代码数量裁员这么奇葩的标准了!🤪

CodeGeeX 是一个具有130亿参数的多编程语言代码生成预训练模型,在20多种编程语言的代码语料库(>8500亿Token)上预训练得到,支持生成 Python、C++、Java、JavaScript 和 Go 等多种主流编程语言的代码。

CodeGeeX 支持代码片段在不同编程语言间进行自动翻译转换,翻译结果正确率高,在HumanEval-X代码翻译任务上超越了其它基线模型。HumanEval-X 是第一个支持功能正确性评测的多语言、多任务的基准,包含820个人工编写的高质量代码生成题目、测试用例与参考答案,支持代码生成与代码翻译能力的评测。

🚧 『Answer』开源知识社区软件

https://github/answerdev/answer

Answer 是一个开源的基于知识的社区软件,可以用来快速构建 Q&A 社区,以获得产品技术支持、客户支持、用户沟通等。

🚧 『Image Processing Node Editor』用节点编辑器执行图像/视频处理的应用

https://github/Kazuhito00/Image-Processing-Node-Editor

Image Processing Node Editor 是一个基于节点编辑器的图像/视频处理应用,可以通过节点构建和拖拽组装流程的方式,构建图像处理流程。Image Processing Node Editor 可以进行图像滤波等基础操作及目标检测等计算机视觉任务,覆盖多种功能。

🚧 『FaceDancer』姿态/遮挡感知的高保真换脸

https://github/felixrosberg/FaceDancer

FaceDancer 是一个基于论文实现的姿态/遮挡感知的高保真换脸,它使用自适应特征融合注意(AFFA)和解释特征相似性正则化(IFSR)等高级方法来精准完成这个任务。

具体说来,AFFA 模块被嵌入到解码器中,自适应地学习融合属性特征和以身份信息为条件的特征,无需任何额外的面部分割过程。在IFSR中,利用身份编码器中的中间特征来保留重要的属性,如头部姿势、面部表情、光照和目标脸部的遮挡,同时仍以高保真度转移源脸的身份。

🚧 『Textual』受网页开发启发的Python文本用户界面库

https://github/Textualize/textual

Textual 是一个 Python 框架,用于创建运行在终端的交互式应用程序,强大的布局引擎、可重复使用的组件使其构建的应用程序能与桌面&网络体验相媲美。在现代终端软件上,Textual 应用程序可以使用 1670 万种颜色,支持鼠标和平滑的无闪烁动画。

博文&分享

👍 『Book4 | Power of Matrix』矩阵力量-从加减乘除到机器学习·书稿

https://github/Visualize-ML/Book4_Power-of-Matrix

这是作者的一套数学书籍,为了让大家学数学、用数学,甚至爱上数学,作者可谓颇费心机。丛书在内容创作时追求极致可视化,使用全彩图解让数学思想跃然纸上,并打破了数学板块之间的壁垒,让大家看到数学代数、几何、线性代数、微积分、概率统计等板块之间的联系,编织一张绵密的数学知识网络。书籍对零基础读者友好,帮助从零开始学习 Python 编程,从写第一行代码到搭建数据科学和机器学习应用。

本书主题是矩阵,包含以下章节:

  • 向量
  • 向量运算
  • 向量范数
  • 矩阵
  • 矩阵乘法
  • 分块矩阵
  • 向量空间
  • 几何变换
  • 正交投影
  • 数据投影
  • 矩阵分解
  • Cholesky分解
  • 特征值分解
  • 深入特征值分解
  • 奇异值分解
  • 深入奇异值分解
  • 多元函数微分
  • 拉格朗日乘子法
  • 直线到超平面
  • 再谈圆锥曲线
  • 曲面和正定性
  • 数据与统计
  • 数据空间
  • 数据分解
  • 数据应用

数据&资源

🔥 『Project Based Learning』C/C++/Java/Python等各种语言项目实战教程大列表

https://github/practical-tutorials/project-based-learning

这是一个教程清单,讲解多种主流编程语言的学习路径,教你从头开始构建应用程序。列表主要包含以下语言,可按需自取:

  • C#
  • C/C++
  • Clojure
  • Dart
  • Elixir
  • Erlang
  • F#
  • Go
  • Haskell
  • HTML/CSS
  • Java
  • JavaScript
  • Kotlin
  • Lua
  • OCaml
  • PHP
  • Python
  • R
  • Ruby
  • Rust
  • Scala
  • Swift

研究&论文

科研进展

  • 2022.10.11 『药物发现』 Equivariant 3D-Conditional Diffusion Models for Molecular Linker Design
  • 2022.10.13 『异常检测』 OpenOOD: Benchmarking Generalized Out-of-Distribution Detection
  • 2022.04.29 『机器学习』 Fast Sampling of Diffusion Models with Exponential Integrator

⚡ 论文:Equivariant 3D-Conditional Diffusion Models for Molecular Linker Design

论文时间:11 Oct 2022

领域任务:Drug Discovery,药物发现

论文地址:https://arxiv/abs/2210.05274

代码实现:https://github/igashov/difflinker

论文作者:Ilia Igashov, Hannes Stärk, Clément Vignac, Victor Garcia Satorras, Pascal Frossard, Max Welling, Michael Bronstein, Bruno Correia

论文简介:Additionally, the model automatically determines the number of atoms in the linker and its attachment points to the input fragments.

论文摘要:基于片段的药物发现一直是早期药物开发的有效范例。该领域的一个公开挑战是设计不连贯的感兴趣的分子片段之间的接头,以获得化学相关的候选药物分子。在这项工作中,我们提出了 DiffLinker,一种用于分子连接器设计的 E(3)-等变 3D 条件扩散模型。给定一组不连贯的片段,我们的模型将缺失的原子置于其间,并设计一个包含所有初始片段的分子。与以前只能连接分子片段对的方法不同,我们的方法可以连接任意数量的片段。此外,该模型会自动确定链接器中的原子数及其与输入片段的连接点。我们证明 DiffLinker 在标准数据集上优于其他方法,可生成更多样化和合成可访问的分子。此外,我们在实际应用中对我们的方法进行了实验测试,表明它可以成功地生成以目标蛋白袋为条件的有效连接子。

⚡ 论文:OpenOOD: Benchmarking Generalized Out-of-Distribution Detection

论文时间:13 Oct 2022

领域任务:Anomaly Detection, OOD Detection, 异常检测OOD检测

论文地址:https://arxiv/abs/2210.07242

代码实现:https://github/jingkang50/openood

论文作者:Jingkang Yang, Pengyun Wang, Dejian Zou, Zitang Zhou, Kunyuan Ding, Wenxuan Peng, Haoqi Wang, Guangyao Chen, Bo Li, Yiyou Sun, Xuefeng Du, Kaiyang Zhou, Wayne Zhang, Dan Hendrycks, Yixuan Li, Ziwei Liu

论文简介:Out-of-distribution (OOD) detection is vital to safety-critical machine learning applications and has thus been extensively studied, with a plethora of methods developed in the literature.

论文摘要:分布外(OOD)检测对于安全关键的机器学习应用至关重要,因此已被广泛研究,文献中开发了多种方法。然而,该领域目前缺乏一个统一的、严格制定的、全面的基准,这往往导致比较不公平和结果不确定。从问题设置的角度来看,OOD 检测与包括异常检测 (AD)、开放集识别 (OSR) 和模型不确定性在内的相邻领域密切相关,因为针对一个领域开发的方法通常相互适用。为了帮助社区改进评估和推进,我们构建了一个统一的、结构良好的代码库,称为 OpenOOD,它实现了相关领域开发的 30 多种方法,并在最近提出的广义 OOD 检测框架下提供了一个全面的基准。通过对这些方法的全面比较,我们很高兴该领域在过去几年中取得了长足的进步,其中预处理方法和正交事后方法都显示出强大的潜力。

⚡ 论文:Fast Sampling of Diffusion Models with Exponential Integrator

论文时间:29 Apr 2022

领域任务:Machine Learning, 机器学习

论文地址:https://arxiv/abs/2204.13902

代码实现:https://github/qsh-zh/deis , https://github/huggingface/diffusers

论文作者:Qinsheng Zhang, Yongxin Chen

论文简介:Our goal is to develop a fast sampling method for DMs with a much less number of steps while retaining high sample quality.

论文摘要:过去几年见证了扩散模型~(DM)在生成建模任务中生成高保真样本方面的巨大成功。 DM 的一个主要限制是其众所周知的缓慢采样过程,这通常需要学习扩散过程的数百到数千个时间离散化步骤才能达到所需的精度。我们的目标是开发一种用于 DM 的快速采样方法,其步骤数少得多,同时保持高样本质量。为此,我们系统地分析了 DM 中的抽样程序,确定了影响样本质量的关键因素,其中离散化方法最为关键。通过仔细检查学习到的扩散过程,我们提出了扩散指数积分器采样器~(DEIS)。它基于为离散化常微分方程 (ODE) 而设计的指数积分器,并利用学习扩散过程的半线性结构来减少离散化误差。所提出的方法可以应用于任何 DM,并且可以在短短 10 步内生成高保真样本。在我们的实验中,在一个 A6000 GPU 上从 CIFAR10 生成 50k 图像大约需要 3 分钟。此外,通过直接使用预训练的 DM,我们在得分函数评估〜(NFE)的数量有限时实现了最先进的采样性能,例如 4.17 FID 和 10 个 NFE、3.37 FID 和 9.74 IS CIFAR10 上有 15 个 NFE。代码在 https://github/qsh-zh/deis

更多推荐

谷歌AI新进展!将静态照片生成3D动图;代码翻译与代码生成工具;C/Java/Python多种语言项目实战教程大汇总;开源知识社区软件;前沿论文 | ShowM