热门
最新
红包
立Flag
投票
同城
我的
发布
TTime:一款开源简洁高效的输入、截图、划词翻译软件
主要功能:输入翻译、截图翻译、划词翻译、悬浮球翻译、截图OCR、静默截图OCR、剪贴板监听翻译。
集成包括DeepL、谷歌、OpenAI多种翻译源和文字识别服务。
GitHub:https://github.com/inkTimeRecord/TTime
TTime 的主要功能:
输入翻译:按 Alt + Q ➡️ 输入文本 ➡️ 按 Enter ➡️ 🌐 翻译结果
截图翻译:按 Alt + W ➡️ 截图 ➡️ 🌐 翻译结果
划词翻译:选中文本 ➡️ 按 Alt + E ➡️ 🌐 翻译结果
悬浮球翻译:选中文本 ➡️ 点击悬浮球 ➡️ 🌐 翻译结果(⚙️ 需要在设置中开启)
截图OCR:按快捷键 ➡️ 截图 ➡️ 📝 文字识别
静默截图OCR:按快捷键 ➡️ 截图 ➡️ 📋 自动保存到剪贴板(无窗口弹出)
CCR:互联网的那点事
AI资讯
CSDN App 扫码分享
评论
点赞
打赏
- 复制链接
- 举报
下一条:
Zero123++:从单一图片,生成多张从不同角度看这个物体或场景的图像。 比如你给它一张正面看的苹果图片,它能给你生成这个苹果从侧面、上面、下面看的图片。 而且生成的多角度图片看起来非常真实,并且从各个角度看都很协调。用户还可以更细致地控制生成图片的各个方面,比如形状、大小等。工作原理:1、条件与训练方案:Zero123++ 利用预训练的2D生成模型(如StableDiffusion)作为基础,并通过多种条件和训练方案进行微调,以生成多视图图像。2、注意力机制:它添加了一个额外的条件分支,并修改了自注意力层的键(K)和值(V)矩阵,以接受额外的条件图像。让模型更专注于输入图片的重要部分,这样生成的多角度图片就更准确。3、全局条件:在原始的Stable Diffusion模型中,全局条件主要来自文本嵌入。Zero123++ 引入了一个可训练的线性引导机制(来自FlexDiffuse),用于在最小化微调程度的同时,将全局图像条件纳入模型中。除了输入图片,它还会考虑其他全局信息(比如文本描述),以生成更符合要求的图片。4、Depth ControlNet:这是一个深度控制网络,用于控制生成过程中的几何结构。它通过渲染与目标RGB图像相对应的标准化线性深度图像,并训练ControlNet来控制Zero123++的几何结构。用于更精细地控制生成图片的形状和结构。GitHub:https://github.com/SUDO-AI-3D/zero123plus论文:https://arxiv.org/abs/2310.15110Demo:https://huggingface.co/spaces/sudo-ai/zero123plus-demo-spaceCR:互联网的那点事
