AI新工具(20240628) Google深夜发布更高性能的大模型Gemma 2；需要图片放大修复的看看这个开源放大器；原型设计Figma推出了一系列AI功能

go2coding 2024-07-31 10:01:02 阅读 77

✨ 1: Gemma 2

Google发布Gemma 2，面向研究人员和开发者的下一代开源模型。

在这里插入图片描述

谷歌推出了最新推出的开放模型 Gemma 2，这是一个轻量级、最先进的开放式模型系列，用创建 Gemini 模型的相同研究和技术构建，现已向全球的研究人员和开发者开放。与第一代相比，Gemma 2 在性能和推理效率上有了显著提升，支持9B和27B参数规模的小模型。其主要特点包括：

卓越性能：27B参数的Gemma 2在其规模类别中表现最佳，甚至可以与更大规模的模型竞争，9B Gemma 2 模型也提供一流的性能，优于 Llama 3 8B 和其他尺寸类别的开放式模型。

高效成本：27B Gemma 2 模型旨在在单个 Google Cloud TPU 主机、NVIDIA A100 80GB Tensor Core GPU 或 NVIDIA H100 Tensor Core GPU 上以全精度高效运行推理，从而在保持高性能的同时显著降低成本。这允许更易于访问且预算友好的 AI 部署。

快速推理：Gemma 2 经过优化，可在一系列硬件上以令人难以置信的速度运行，从功能强大的游戏笔记本电脑和高端台式机到基于云的设置。在 Google AI Studio 中全精度试用 Gemma 2，在 CPU 上使用 Gemma.cpp 的量化版本解锁本地性能，或者通过 Hugging Face Transformer 在配备 NVIDIA RTX 或 GeForce RTX 的家用计算机上试用。

Gemma 2 还改进了安全性和兼容性，被设计成易于与现有的AI工具和框架（如Hugging Face、JAX、PyTorch、TensorFlow 等）集成。开发者可以通过Google AI Studio 和Kaggle 免费试用或下载Gemma 2的模型权重。

这款新模型的一些安全发展包括数据过滤、严格的测试和评估，以避免潜在的偏见和风险。

地址：https://blog.google/technology/developers/google-gemma-2/

✨ 2: aurasr

AuraSR 是一个开源的GigaGAN放大器，能将低分辨率图像无损放大4倍。

在这里插入图片描述

AuraSR是一个开源重现GigaGAN图像提升的模型，拥有600M参数。它可以将低分辨率图像提升至原图像的4倍，并且可以多次应用。该模型特别适用于通过文本生成图像的模型上，并且在分辨率和提升倍数上没有限制。相比于基于迭代过程的扩散模型，AuraSR使用生成对抗网络（GAN）技术，通过一次前向传播就能完成图像生成和提升，速度要快很多。例如，它能够在0.25秒内生成1024像素的图像（提升4倍）。

该模型在完全开源的许可下发布，致力于广大开发者和研究人员的使用。

github:https://github.com/fal-ai/aura-sr

地址：https://blog.fal.ai/introducing-aurasr-an-open-reproduction-of-the-gigagan-upscaler-2/

✨ 3: figma

Figma 是一个集设计、原型制作与跨团队协作的强大工具。

在这里插入图片描述

Figma 是一款集设计与原型于一体的工具，主要帮助设计师和团队协作高效完成设计工作。它包括以下几个主要模块：

Figma Design：这是Figma的核心模块，支持用户在一个地方进行设计和原型制作。

FigJam：一个数字白板工具，方便团队协作和头脑风暴。

Dev Mode：帮助设计和开发对接，轻松将设计转换为代码。

Figma Slides（Beta版）：用于创作演示文稿的工具，支持协同创作，预计2025年正式发布。

Figma最近在2024年的Config大会上推出了多个新功能和产品：

AI功能：通过AI提高设计效率，包括自动生成设计草稿、重命名图层、即时生成原型等。

重新设计的UI：UI3编辑器更加易用和灵活。

新的Dev Mode视图和功能：包括新的状态标签、细化设计视图、以及从支持的UI组件库直接添加代码。

Figma Slides：一个新的演示工具，具有高级设计功能和协同创作工具。

此外，Figma还完善了其他基础功能，例如响应式的自动布局、更灵活的原型查看器、以及提供默认UI组件库以加速设计过程。

地址：https://www.figma.com/whats-new/

✨ 4: gpt-frontend-code-gen

gpt-frontend-code-gen 是一款通过对话生成和迭代前端页面的工具。

在这里插入图片描述

gpt-frontend-code-gen 是一个基于 React 和 Vite 构建的前端项目，配合 Koa 框架的后端服务，用于生成和预览前端页面和组件。通过与系统对话，用户可以不断调整页面效果，实现高效的前端开发。

生成 React 组件：基于 GPT-4，可以生成不同的 React 组件。

组件库支持：支持生成 Chakra UI 组件和 ShadcnUI 组件。

实时预览：生成的组件可以实时预览。

持续对话修改：通过与系统持续对话，可以即时修改和更新生成的组件。

多模型支持：配置自己的 APIKey 和 BaseUrl，支持多种大模型。

一键启动：使用 Docker 和 Docker Compose 实现一键设置和启动。

地址：https://github.com/bravekingzhang/gpt-frontend-code-gen

✨ 5: Rodel Agent

Rodel Agent 是一款集成多种AI服务的Windows桌面应用。

在这里插入图片描述

Rodel Agent是一款Windows桌面应用程序，集成了聊天、文本转图像、文本转语音和机器翻译等功能，支持当前主流的AI服务，致力于为用户提供卓越的桌面AI体验。

聊天功能：用户可以通过Rodel Agent与AI进行互动对话，获取信息或进行日常交流。

文本转图像：用户可以输入文字描述，通过AI生成相应的图像，适用于创意设计和快速图像生成。

文本转语音：将文字内容转换为语音播放，适用于有听力需求的用户或语音广播任务。

机器翻译：进行多语言的即时翻译，提升跨语言交流的效率。

地址：https://github.com/Richasy/Rodel.Agent

更多AI工具，参考国内AiBard123，Github-AiBard123 公众号：每日AI新工具

上一篇：零基础入门AI：四步快速搭建本地的编程助手

下一篇： OpenCV与AI深度学习 | OpenCV中八种不同的目标追踪算法

本文标签

AI新工具(20240628) Google深夜发布更高性能的大模型Gemma 2；需要图片放大修复的看看这个开源放大器；原型设计Figma推出了一系列AI功能

声明

本文内容仅代表作者观点，或转载于其他网站，本站不以此文作为商业用途
如有涉及侵权，请联系本站进行删除
转载本站原创文章，请注明来源及作者。