2023.07-09--第13期

一、刊首图

最大的球形建筑

拉斯维加斯的威尼斯酒店,最近建了一个球馆,非常奇特。它是全球 最大的球形建筑,同时也是全球最大的LED装置,高111米,宽516米。它的外壳都是 LED 屏幕,可以对外播放球形视频,夜晚亮灯,极其夺目。它的内部则是一个正常的球馆,可以举办大型体育比赛和演唱会。

二、时事新闻

1、谷歌量子计算机6秒内完成47年计算

谷歌宣称,他们的量子计算机在短短6秒,完成世界最先进计算机47年的计算量。谷歌研究团队的最新发现已发表在 arxiv 上。论文称,谷歌最新Sycamore量子处理器目前拥有70个量子比特,而2019年版本只有53个量子比特。量子比特的增加,意味着可以成倍地提高量子计算机的性能,这使得新处理器的稳健性大约是以前的2.41亿倍。最新研究将标志着,量子计算迎来里程碑时刻。凭借其计算优势,谷歌的量子计算机有望彻底改变包括人工智能在内的各个领域。以前所未有的速度解决复杂问题,有望解锁下一代人工智能模型,突破许多领域从未超越的界限。

2、Meta 发布可商用的 llama-2

Llama 可以说是 AI 社区内最强大的开源大模型,但因为开源协议问题,一直不可免费商用,现在 Meta 终于发布了免费可商用版本 Llama 2。

此次 Meta 发布的 Llama 2 模型系列包含 70 亿、130 亿和 700 亿三种参数变体。此外还训练了 340 亿参数变体,但并没有发布,只在技术报告中提到了。据介绍,相比于 Llama 1,Llama 2 的训练数据多了 40%,上下文长度也翻倍,并采用了分组查询注意力机制。具体来说,Llama 2 预训练模型是在 2 万亿的 token 上训练的,精调 Chat 模型是在 100 万人类标记数据上训练的。

llama2可免费商用

3、清华团队发布 ChatGLM2-6B

为了更好地支持国产大模型开源生态的繁荣发展,经智谱 AI 及清华 KEG 实验室决定,自2023.7.14日起 ChatGLM-6B 和 ChatGLM2-6B 权重对学术研究完全开放,并且在完成企业登记获得授权后,允许免费商业使用。

4、手机 App 备案

工信部宣布,从9月开始推行手机 App 备案(包括小程序),类似现有的网站备案。明年4月起,未备案的 App 不得提供接入。

5、激光庆祝

一家德国公司为了庆祝成立100周年,本月在总部向天空发射绿色激光,作为生日蜡烛。这个激光高达10公里,方圆80公里范围内都能看到,是目前世界最大的绿色激光。

激光庆祝

6、DALL·E 3支持使用ChatGPT创建提示

走在 AI 前沿的 OpenAI 发布了图像生成工具 DALL-E 第三个版本的预览版。不仅如此,DALL-E 3 与 ChatGPT 集成,允许用户使用 ChatGPT 创建提示并包含更多安全选项,生成图像不再需要复杂的 prompt 了。

7、Unity修改收费政策

自 Unity 宣布开发者需为 每次游戏安装付费 以来, 业界人士和游戏工作室的强烈不满就在持续发酵。在此前的多次让步没有得到认可后,官方终于全面调整了相应规则。在公开信中,Unity Create 负责人 Marc Whitten 就游戏安装付费政策带来的风波致歉,下图是调整后的规则。

Unity修改收费政策

三、技术文章

1、Transformer 是什么(英文)

Nvidia 官网博客文章,介绍 GPT 模型的核心算法 Transformer 的基本情况,不涉及技术细节,但是很全面。

2、AI 作图引擎比较(英文)

目前,AI 作图引擎主要有五个:Adobe Firefly、OpenAI DALLE-2、OpenJourney、Stable Diffusion、Midjourney。作者进行了比较,发现最稳定、可用性最好的是 Midjourney 和 Stable Diffusion。

3、个人网站集成 GitHub issue 评论功能(中文)

作者采用 VitePress 搭建博客,本文介绍他怎么引入 GitHub issue 作为网站的评论功能。

个人网站集成GitHub-issue评论功能

4、copilot-analysis(中文)

作者逆向分析了Github Copilot 代码自动补全工具的详细实现。

5、老旧 MacBook 如何安装 Linux(英文)

一篇详细的指南,教你怎么把过时的 Macbook 利用起来,装上 Linux。

6、全方位对比 Postgres 和 MySQL (2023 版)(中文)

Postgres 和 MySQL 是两大最主流的关系型数据库,本文对它们进行全方位的比较。

7、GitHub支持无密码登录(英文)

GitHub 宣布,现在已经开始支持无密码登录了,本文教你怎么打开这个功能。

GitHub支持无密码登录

8、如何破解滑动验证码?(中文)

本文介绍了图片滑动验证码的实现原理和流程分析,以及如何破解。

9、哈希是什么(英文)

一篇入门科普文章,图文并茂,通俗解释哈希的原理以及如何使用。

四、开源组件

1、Logan

面向终端的统一日志服务。由美团技术团队开源的一整套前端日志系统,包含客户端 SDK、日志处理和管理平台。它适用于移动端 APP、Web、小程序、IoT 等终端场景下的实时日志收集。

Logan

2、redpanda

与 Kafka API 完全兼容的流数据平台。这个项目可以看作是用 C++ 重新编写的 Kafka,它更轻、更快、更省钱,部署简单使用方便,完全不受 JVM、ZooKeeper 等外部依赖的影响。

redpanda

3、privateGPT

privateGPT 是基于 GPT4All-J 的私有化部署文档问答平台,无需联网,能 100% 保证用户的隐私不泄露。它提供了一个 API,用户可以使用自己的文档进行交互式问答和生成文本。此外,平台支持自定义训练数据和模型参数,以满足个性化需求。

4、langflow

Langflow 是一个LangChain UI,提供了一种交互界面来使用LangChain,通过拖拽即可搭建自己的实验、原型流。官方使用示例

LangFlow

5、fastllm

纯c++的全平台llm加速库,支持python调用,chatglm-6B级模型单卡可达10000+token / s,支持glm, llama, moss基座,手机端流畅运行。

6、chroma

AI-native开源向量数据库,使用内存构建Python或JavaScript LLM应用程序的最快方法。

7、DragGAN

DragGAN 的官方源码,它支持通过鼠标拖拽的方式对图像进行编辑。任何人都可以通过精确控制像素去向,轻松修改图像中物体的姿态、表情、形状、布局等。

DragGAN

8、AnimateDiff

AnimateDiff: Animate Your Personalized Text-to-Image Diffusion Models without Specific Tuning 论文 的官方实现,可以使用文生图的扩散模型制作动画。

9、Baichuan-13B

Baichuan-13B 是由百川智能继 Baichuan-7B 之后开发的包含 130 亿参数的开源可商用的大规模语言模型,在权威的中文和英文 benchmark 上均取得同尺寸最好的效果,可以免费商用。

10、asynq

纯 Go 写的简单、可靠的分布式任务队列。这是一个基于 Redis 的轻量级异步任务队列,它会为每个任务启动一个 goroutine,支持任务失败重试、优先级队列、定时任务、唯一任务等功能。

asynq

11、compress

强大的 Go 语言压缩库。该项目包含了多种压缩算法,支持实时压缩算法 zstandard、Snappy 优化版压缩算法 S2 等,还可用来替代 gzip、zip、zlib 等标准库。

12、pop

这是一款用 Go 写的命令行发邮件的工具,它支持 TUI 和命令行两种使用方式,还以可以通过管道和其它工具结合。

13、Flowise

用拖拽的方式构建大模型应用。该项目可以让你通过可视化、拖拽组件的方式自定义大模型(LLM)流程,轻松构建 LLM 应用,支持 Docker 一键启动服务。

Flowise

14、cudf

支持 GPU 的数据库处理 Python 库。它相当于支持 GPU 的 pandas,处理数据的速度直接起飞。提供了类似 pandas 的 API,支持加载、合并、聚合、过滤等方式操作数据。

15、fastkafka

为你的 Web 服务轻松集成 Kafka 的 Python 库。基于 Pydantic、AIOKafka 构建的 Python 库,可用于快速开发与 Kafka 交互的异步 Python 程序。

16、PandaLM

PandaLM旨在提供可复现且自动化的大型语言模型(LLM)之间的比较。论文地址:PandaLM: An Automatic Evaluation Benchmark for LLM Instruction Tuning Optimization

PandaLM

17、codeinterpreter-api

ChatGPT代码解释器的开源实现。

18、background-removal-js

一个去除图片背景的 JS 库。

background-removal-js

19、simple-statistics

一个统计学的 JS 库,提供基本的统计函数。

20、ColossalAI

Colossal-AI 是一个统一的并行训练系统,专为深度学习的大型模型设计,解决了单个 GPU 或单个机器上训练大型模型的问题。这个系统整合了不同的并行化技术范式,包括数据并行、管道并行、多张量并行和序列并行,以支持分布式环境中的训练。论文地址

21、lightning

Lightning 是一个轻量级而强大的深度学习框架,专为提高代码可读性和可重用性而设计;集成了多种主流加速框架,如 DeepSpeed,ColossalAI 等,且能够一键式切换。

Lightning

22、audiocraft

Meta 开源的文本生成音乐的库。该项目可根据文本提示词生成高质量、高保真的音频和音乐,比如吹着风吹口哨、一段适合海滩场景的流行舞曲,生成效果十分惊艳。

audiocraft

23、orange3

一款基于Python的数据挖掘和可视化工具,它提供了丰富的数据分析、机器学习和数据挖掘算法,同时也支持可视化分析和交互式数据探索。它提供了友好的界面和丰富的示例工程,使得新手用户也可以快速上手,同时也支持Python脚本,可以满足高级用户的需求。

Orange3

24、open-interpreter

Open Interpreter是一个开源工具,提供交互式和编程聊天功能,让用户可以通过在终端中运行解释器与其进行对话。开发人员可以编写任务和工作流程脚本,直接传递消息给解释器,以便更精确地控制。用户可以检查和配置系统消息,以满足个人偏好和项目要求的灵活性。

  • Open Interpreter 不仅仅是另一个编码解释器。它是一个专注于复杂任务的强大工具,允许语言模型在您的计算机上运行代码,以完整地编写应用程序、任务等。它是 OpenAI 代码解释器的实现,可以运行 GPT-4 和其他模型,支持 Python、JavaScript、Shell 等语言的代码。
  • Open Interpreter 的独特功能之一是其终端中类似聊天的界面,允许用户以更直观和用户友好的方式与之交互。该解释器不仅可以编写代码,还可以创建和编辑照片、视频、PDF 和其他文件。它可以控制网络浏览器进行网络搜索,并通过网络上的不同区域进行搜索,以实现并提供必要的链接。

Open-Interpreter

25、mux

一个强大的 HTTP 路由器和 URL 匹配器,可用来构建 Go Web 服务器。

26、typesense

一个用 C++ 编写的即时搜索引擎,具有开箱即用、搜索速度快、自动更正拼写错误、地理搜索、默认分词器支持中文等特点。

typesense

27、carbon

一个对开发者友好的 Go 时间处理库。这是一个功能丰富、容易上手的 Go 时间库,支持时间转换、时间差、时间旅行、星座、季节、农历、多语言等功能。

28、argos-translate

用 Python 写的开源离线翻译库。该项目是基于 OpenNMT(神经网络机器翻译框架)的离线翻译 Python 库,它不依赖任何第三方翻译接口,支持翻译包括中文在内的 30 多种语言。

29、hcaptcha-challenger

优雅地处理 hCaptcha 验证码的库。该项目不依赖浏览器插件和第三方反验证码服务,通过机器学习的方式处理 hCaptcha 验证码。它采用 ResNet 和 YOLOv8 处理分类和检测问题,通过 ONNX 打包模型降低使用门槛,让用户可在没有 GPU 的设备上运行代码,且无需安装 PyTorch 等依赖,优雅地面对 hCaptcha 验证码。

hcaptcha-challenger

30、jax

谷歌开源的高性能科学计算库。这是一个结合了即时编译(JIT)、自动求导(Autograd)、线性代数编译器(XLA) 的数值计算 Python 库,用法和 NumPy 差不多。但 JAX 更快、更省内存,支持自动微分、自动向量化、并行计算等功能。

31、fuzi.mingcha

夫子•明察司法大模型是由山东大学、浪潮云、中国政法大学联合研发,以 ChatGLM 为大模型底座,基于海量中文无监督司法语料与有监督司法微调数据训练的中文司法大模型。该模型支持法条检索、案例分析、三段论推理判决以及司法对话等功能,旨在为用户提供全方位、高精准的法律咨询与解答服务。

夫子明察司法大模型

32、AgentVerse

AgentVerse 提供了一个多功能的框架,简化了为大型语言模型(LLMs)创建自定义多智能体环境的过程。旨在快速、低成本的开发和定制。

五、工具软件

1、sqlitebrowser(开源)

SQLite 可视化管理工具。这是一款实用的 SQLite 数据库桌面管理工具,它支持创建和编辑 SQLite 数据库文件,可通过图形化界面创建、定义、修改、删除表和索引,以及执行 SQL 和导出数据等操作。

2、sourcegraph(开源)

一款强大的代码搜索平台。该项目能够对代码库进行语义索引和分析,支持正则表达式搜索、输入搜索条件时的自动补全、类似 IDE 的跳转到定义和引用。它可以用于构建公司内部的代码搜索平台,帮助程序员完成跨项目的代码查找、代码审查、代码追踪等。

sourcegraph

3、gotenberg(开源)

基于 Docker 的生成 PDF 文件服务。它支持通过 Docker 启动一个服务,该服务可以通过 API 与 Chromium 和 LibreOffice 进行交互。让你可以通过调用接口,轻松地将网页、HTML、Markdown、Word、Excel 等格式的文档转换为 PDF 文件。

4、SurveyKing(开源)

功能强大的调查问卷系统。这是一款 Java 写的问卷调查和考试系统,支持 20 多种题型、Excel 导入问卷、白名单答卷、公开查询、数据导出等功能。

SurveyKing

5、Auto_Bangumi(开源)

全自动追番工具。该项目是 Python 写的自动订阅更新和下载动画的工具,用户只需在 Mikan Project 上订阅番剧,然后简单配置一下就可以安心追番了。

Auto_Bangumi

6、LocationSimulator(开源)

iOS 设备的定位模拟器。这是一个能够轻松修改 iOS 和 iPadOS 位置信息的 macOS 应用,使用时手机端无需越狱和安装应用,只需通过 USB 或 WiFi 将设备连接上电脑,即可轻松完成位置修改。

LocationSimulator

7、BlackHole(开源)

一款高颜值的音乐播放器应用。该项目是用 Flutter 写的高颜值、无广告、免费音乐播放器,拥有歌词、专辑、艺术家、播放列表、定时关闭等功能,支持 Android、iOS、macOS 系统。

BlackHole

8、web-vitals(开源)

Google 开源的核心页面指标。该指标可以帮助站长提升网站的用户体验,它分为 LCP(加载性能)、FID(交互性)、CLS(视觉稳定性) 三个方面。

web-vitals

9、light-chaser(开源)

数据可视化大屏设计器,基于 React + Mobx。

Light-Chaser

10、safeline(开源)

开源的 WAF(应用程序防火墙),挡在网站之前对 Web 流量进行安全清洗。

safeline

11、ICP Query(开源)

开源的 Chrome 浏览器插件,显示网站 ICP 备案、Whois、DNS、服务器位置及运营商信息。Chrome商店安装

ICP Query

12、ChatLaw(开源)

清华大学团队开源的中文法律大模型,使用大量法律新闻、法律论坛、法条、司法解释、法律咨询、法考题、判决文书等原始文本来构造对话数据。官方体验

ChatGLM

13、gpt-migrate(开源)

基于ChatGPT的工具,可以将代码库从一种框架或语言迁移到另一种框架或语言。

14、h2ogpt(开源)

开源 GPT,具有文档和图像问答、100% 私人聊天、无数据泄露。

h20gpt

15、Rsync time backup(开源)

一个命令行工具,类似于苹果的 Time Machine 备份工具,对文件和目录进行增量备份,以后可以恢复到任意时点,支持跨平台使用。

16、tgscan(开源)

一个开源的Telegram搜索引擎,可以的轻松找到频道、群组。在线体验

tgscan

17、langchain-ChatGLM(开源)

一种利用 langchain 思想实现的基于本地知识库的问答应用,目标期望建立一套对中文场景与开源模型支持友好、可离线运行的知识库问答解决方案。

实现原理及过程:加载文件 -> 读取文本 -> 文本分割 -> 文本向量化 -> 问句向量化 -> 在文本向量中匹配出与问句向量最相似的top k个 -> 匹配出的文本作为上下文和问题一起添加到prompt中 -> 提交给LLM生成回答。

langchain-ChatGLM

18、Gitstars(开源)

一个开源的 Web 服务,用来管理你在 GitHub 打过星标的项目。

19、kafka-console-ui(开源)

一款轻量级的 Kafka 可视化管理平台。

kafka-console-ui

20、Spring Startup Ananlyzer(开源)

Spring 性能分析工具,收集启动过程数据,生成交互式分析报告。

21、FastGPT(免费)

新兴搜索引擎 Kagi 推出的 GPT 聊天,免费使用,响应很快,支持中文。

FastGPT

22、naxsi(开源)

高效、易用的 Nginx 防火墙。这是一款专业的 Nginx Web 应用防火墙,可用来抵御 SQL 注入、XSS 攻击等。它采用白名单的防御方式,规则配置简单、功能强大,支持拦截和学习模式。学习模式可辅助发现未知攻击,生成、优化白名单规则。

23、relation-graph(开源)

支持Vue和React的 关联关系图谱组件,可以展示如组织机构图谱、股权架构图谱、集团关系图谱等知识图谱,可提供多种图谱布局,包括树状布局、中心布局、力学布局自动布局等。

relation-graph

24、dm-ticket(开源)

Rust 写的大麦网自动购票工具。大麦网的抢票工具,仅支持购买 H5 页面上的票,不支持选座。

25、Starward(开源)

Starward 是一个米家游戏启动器,支持米哈游旗下的所有桌面端游戏,目标是完全替代官方的启动器,并在此基础上加入一些拓展功能。除了游戏安装之外,还具备以下功能:记录游戏时间、切换游戏账号、浏览游戏截图、保存抽卡记录、米游社工具箱。

Starward

26、buzz(开源)

Buzz在您的个人电脑上离线转录和翻译音频,由OpenAI的Whisper技术驱动。

buzz

27、webp_server_go(开源)

一款开箱即用的 WebP 服务器。WebP 是谷歌开发的一种为了提升图像加载速度的图片格式,该项目是用 Go 写的 WebP 服务,无需二次开发就能实现将 JPG、PNG、BMP、SVG 等格式的图片,转化成 WebP 格式的服务,能够有效地减小图片体积、节省带宽、提升图片加载速度。

28、Mist(开源)

自动下载 macOS 系统固件的工具。这款工具可以列出所有可供下载的 macOS 固件/安装程序的信息,包括名称、版本号、发布日期和大小。

Mist

29、SkeletonView(开源)

一款优雅的 Swift 骨架屏库。骨架屏是在页面展示所需的数据还未加载完成时,先展示出页面大致结构的一项技术。这个 Swift 骨架屏库容易上手、接口友好,支持所有 UIView、自定义动画等功能。

SkeletonView

30、Fooocus(开源)

一款开箱即用的图片生成软件。该项目在设计时吸收了 Stable Diffusion 和 Midjourney 的优点,它安装简单、操作方便,省去了复杂的参数调节步骤。用户只需要输入提示词,就可以生成与 Midjourney 水平相当的图片。支持本地部署、离线使用,最低配置要求 8GB 内存和 4GB 的 Nvidia 显卡。

Fooocus

31、topspeed-image-compressor(开源)

一款图片压缩软件,有在线版和 Windows 桌面版。在线版

topspeed-image-compressor

32、MusicFreeDesktop(开源)

一个开源的音乐播放器,通过插件支持各种音源,参见 示例插件库

MusicFreeDesktop

33、Android-Touch-Helper(开源)

一个安卓系统的开屏广告自动跳过助手。不需要网络权限,不需要存储权限,不会收集或者上传任何信息,不存在隐私问题。

本程序使用三种方法跳过开屏广告:

  • 关键字。在应用中查找含有关键字的按钮,如果发现了对应的按钮,自动帮用户点击从而跳过广告。
  • 应用的指定控件。当应用工作时,自动查找对应的控件,如果找到则自动点击;
  • 应用的指定位置。当应用工作时,自动点击对应的区域。

34、whisper-web(免费)

不必登录,将英语音频转成文本的在线工具。

Whisper-Web

35、file-bridge(开源)

一个简单的 JS 脚本,用来架设静态文件服务器。A 电脑在网页上打开一个本地文件目录,B 电脑就能下载里面的文件,两者不必在同一局域网。试用地址

36、StableDiffusion XL(免费)

SDXL 是 Stable Diffusion 最新发布的画图模型。这是网友架设的体验站,不需要登录也不需要付费,直接体验文生图。

StableDiffusion-XL

37、instagraph(开源)

使用ChatGPT将文本输入或URL转换为知识图谱并显示。

38、optimizer(开源)

一款强大的 Windows 系统优化工具,它体积小、功能丰富,支持包括中文在内的 22 种语言,能够禁用不必要的 Windows 服务、删除多余的启动程序、关闭用不到的功能,提升 Windows 系统的使用体验和性能。

optimizer

39、Translumo(开源)

开源的屏幕实时翻译工具。该项目可以对屏幕上选定区域内显示的文本进行实时翻译,可识别英语、俄语、中文等语言。用户可自行选择 Tesseract、WindowsOCR、EasyOCR 多种 OCR 引擎,以及包括谷歌翻译在内的多种翻译源。

Translumo

40、Stirling-PDF(开源)

允许对 PDF 文件做各种操作的 Web 应用。这是一款功能强大、开箱即用的 PDF 工具,支持拆分/合并文件、添加/提取图片、压缩、加水印、添加/删除密码等功能,满足你对 PDF 文件的所有需求。

Stirling-PDF

41、Bangumi(开源)

类似豆瓣的二次元爱好者社区客户端。这是一个基于 React Native 构建的二次元社区 Bangumi 第三方客户端。它免费、无广告、因爱好而生、专为移动端设计,支持番组进度管理、用户动态、贴吧、搜索、排行榜、标签等功能。

Bangumi

42、deprank(开源)

通过 PageRank 找到代码库中最重要的文件。该项目基于 PageRank 算法和源文件依赖关系,找到 JavaScript/TypeScript 代码仓库中被依赖最多的文件。

deprank

43、json-server(开源)

这是一款小巧的接口模拟工具,它使用起来十分简单,只需创建 JSON 文件,然后一条命令就能快速启动接口服务。

json-server

44、mind-map(开源)

该项目包含一个不依赖任何框架的思维导图 JavaScript 库,以及一个采用 Vue.js+ElementUI 开发的支持本地部署、功能丰富的在线思维导图应用。

mind-map

45、gkd(开源)

自定义屏幕点击的 Android 应用。该项目是基于无障碍功能的手机自动点击工具,支持自定义或订阅点击规则,可用来自动完成点击跳过广告、同意按钮、领红包等操作。

gkd

46、telegram-get-remote-ip(开源)

在 Telegram 中获取对方音频通话的 IP 地址。

47、tldraw(开源)

tldraw 是一个可共享的在线白板,它的编辑器、Ul、底层库都是开源的,你也可以将它嵌入到自己的项目中,构建自己的画布。在线体验

tldraw

六、学习资源

1、Clean-Code-Notes(英文)

该书从什么是 Clean Code 讲起,一步步教你如何写出简洁、容易理解和维护的代码,帮助你养成良好的编码习惯。

2、AI-For-Beginners(英文)

微软开源的入门级人工智能教程。这是一份完全免费、面向零基础人群的 AI 课程,为期 12 周共计 24 节课。你将学习到关于 AI 的历史、基本知识、主流框架、CV 和 NLP 等知识。

AI-For-Beginners

3、LLMs-In-China(中文)

中国大模型列表,一个收集性质的项目,旨在记录中国大模型发展情况。

4、LLMSurvey(中文)

调查论文“大型语言模型调查”的官方 GitHub 页面。

5、Pirate Weather(英文)

一个免费的天气 API,每月可调用2万次。

Pirate-Weather

6、APIVault(英文)

这个网站收集了大量公共 API,相当于 API 的搜索引擎,用户可以提交新的 API。

APIVault

7、telegram-groups(中文)

一个收集性质的资源列表,精选优质Telegram群组、频道和机器人。

8、kafka-in-production(英文)

一个收集性质的资源列表,汇集了在生产环境中运行 Kafka 的企业技术博客和讲座。

9、Awesome-Chinese-LLM(中文)

整理开源的中文大语言模型,以规模较小、可私有化部署、训练成本较低的模型为主,包括底座模型,垂直领域微调及应用,数据集与教程等。

Awesome-Chinese-LLM

10、awesome-ChatGPT-repositories(中文)

一个精选的资源列表,专门收集与ChatGPT相关的开源GitHub存储库。

11、awesome-langchain(英文)

一个收集性质的资源列表,汇集了很多与LangChain相关的项目。

12、ToolAI(英文)

AI 网站目录,收录了全球5000个 AI 网站。

ToolAI

13、通往 AGI之路(中文)

旨在提供一个全面系统、易于理解的 Al 学习路径,帮助了解 Al 的从概念到应用等各方面知识,实现更清晰的“我可以用 Al 做什么,帮助自己更强大”目标。

14、llm-action(中文)

旨在分享大模型相关技术原理以及实战经验。

llm-action

15、SoftwareArchitect(英文)

通往架构师之路。这是一份教你如何成为架构师的学习指南。

16、高校校徽字体图标库(中文)

这个仓库收集了全国200多所高校的校徽,制作成字体图标。

17、Iconbuddy(英文)

一个很好用的图标搜索引擎,收入了10万+的图标,可以定制和下载每个图标。

iconbuddy

18、Awesome AIGC Tutorials(中文)

该仓库收集各种生成式 AI 的教程。

19、Awesome-Domain-LLM(中文)

这个仓库收集各种垂直领域的大语言模型。

20、动手学深度学习(中文)

一本关于深度学习的开源书籍,中英文版被70多个国家的500多所大学用于教学。在线阅读

动手学深度学习

21、LearnPrompt(中文)

免费开源的 AIGC 课程。该项目对新手友好、无需 AI 知识也可轻松学习,它不仅会传授如何用好 AIGC,还会深入讨论 AI 相关的知识,内容包括 ChatGPT、Runway、Midjourney、Stable Diffusion、AI 数字人等方面。在线阅读

22、LLM-Agent-Paper-List(英文)

基于大型语言模型的Agent兴起和潜力的调查。

23、SGK_Sites_and_Bots(中文)

免费在线社工库查询网站和Telegram电报社工库机器人分享。

七、生活经验

1、冰山的底部

人们总是说,冰山露出水面的部分不到20%。一个德国的水下摄影师,特意前往格陵兰,拍摄水下的冰山。

冰山的底部

2、《芯片战争》作者专访

专访畅销书《芯片战争》作者克里斯·米勒,谈美国芯片战略和中美芯片竞争。

3、最大的化石花

1872年,在北欧波罗的海附近,发现了一块距今3000多万前的琥珀化石。令人震惊的是,这块化石里面有一朵完整的花。这是已知最大的化石花,花瓣长达28毫米,我们可以看到它在3000多万年前盛开的样子。

最大的化石花

4、有效笔记的三个原则

三个原则可以帮助你有效地记笔记。

  • 笔记必须符合你的思维方式:做笔记要按照自己的思考方式,不能原封不动地按照老师(或者书本)的讲解方式。这样不仅你写起来更轻松,而且将来回顾笔记的时候,你也更容易理解自己当时的想法。
  • 笔记必须代表你的知识:笔记不要仅仅复制/粘贴他人的话语,而要用自己的语言表达。你不妨标记清楚,哪些地方是已经理解的,哪些地方还没有理解或者有疑问。
  • 笔记必须可以轻松检索:为了最大限度利用自己的笔记(其实也是节约自己的时间),它必须可以方便地检索。你要为每个部分写一个标题,并且定期整理出一份目录。

5、“进化”这个词正确吗?

本文讨论一个观点,“进化”这个词是否应该改成“演化”?因为生物更多是在适应环境,不一定变得进步。

进化过程

6、爱奇艺 TV 版如何占用用户带宽

电视机装了爱奇艺 TV 版,息屏状态下,居然在上传数据,只有拔掉电源才会停止。它默认把用户机器用作 CDN 节点。

7、泳池机房

机房产生大量热量,需要散热。一家英国公司想到了建造“泳池机房”,把机房建在游泳馆,让其为温水泳池供暖。该机房主要面向机器学习和人工智能客户,所有服务器浸在冷却液中散热,冷却液再与泳池的水进行热交换。该公司声称,这样可以让温水泳池的加热费用减少62%。他们正在说服更多游泳馆,允许他们改造排水系统,加入服务器。

泳池机房

8、不要用生产力这个词来评价程序员

“生产力”这个词,英文为 productive,它的高低用产品的多少来衡量。生产力高,就是同样的时间做更多的工作,或者同样的工作花费更少的时间。如果使用“生产力”评价一个人的价值,最终就一定变成追求更高的产出。这是没有止境的,机器可以 24x7 工作,人不能。

  • 软件行业一直有一种说法,我们要招聘10倍生产力的程序员。它的言下之意,就是要招聘10倍产出的人,这种目标并不可取。当你强调生产力时,实际上是在强调,人必须始终忙碌。每一刻都有事情要做,而且总是有更多事情要做! 因此,你会有做不完的工作,闲暇时间越来越少,工作压力越来越大。
  • 程序员的真正目标,应该是“有效性”(effective)。你的劳动是有效的,切实完成了项目。当你把“有效性”当作目标时,只要有效完成了项目,你就可以停下来了。因此,你可以追求做更少的事情、用更少的时间达到目标,这样你会得到更多的闲暇和休息,这才是可持久的。
  • 生产力目标(productive)占用你所有的时间,把你的日程排满,追求尽可能多的产出。有效性目标(effective)正好相反,它不追求添加更多的任务,而且减少那些不该做的事情。

如果有人称赞你,说你的生产力很高,或者公司以生产力作为考核指标。你可能需要小心,你有变成机器的风险。更好的称赞应该是,你的劳动很有效,很高效。不要当工作狂,应该追求更少的代价取得同样的效果。

9、最长的视线

2016年7月16日,一位摄影师在西班牙海拔2820米的比利牛斯山脉上,拍到了一张照片,可以看到远处的阿尔卑斯山。这两个地点相隔443公里,被吉尼斯认证为世界最长的视线,没有人看得比这更远了。

最长的视线

10、冬季高温

现在,北半球是盛夏,南半球应该是寒冬。问题是,南半球不仅没有寒冬,而且出现了骇人的高温。进入八月后,智利的气温超过37.8℃,创下历史纪录。阿根廷首都布宜诺斯艾利斯平均气温超过30度,往年则是14.4℃。

11、绿色海洋

蓝色大海,以后可能变成绿色大海。英国海洋研究中心发表报告,根据20年来的卫星观测,科学家发现,由于气候原因,海洋正变得越来越绿。主要原因是海温上升,以及大气二氧化碳含量增加,大大促进了浮游植物的生长。这些浮游植物含有叶绿素,能反射绿光。凡是它们大量繁殖的地方,海洋就会变成绿色。

绿色海洋

12、ai 域名

顶级域名.ai属于安圭拉(anguillas),它是英国控制的加勒比海小岛,面积只比香港本岛大一点。AI 热潮使得.ai域名炙手可热,为安圭拉带来巨大财富。一个 ai 域名的年费现在是80美元左右(约人民币600元),还在上涨。2021年安圭拉从.ai域名注册获得了740万美元。现在出现了 ChatGPT,今年的收入估计可达3000万美元,占到当地 GDP 的10%。安圭拉人口只有1.5万,相当于每人每年分到2000美元,真的是天上掉下来的财富。

安圭拉的ai域名

八、闲情逸趣

黄仁勋 SIGGRAPH 2023 主题演讲:探索 AI 的未来

在全球知名的计算机图形大会 SIGGRAPH 舞台,NVIDIA 创始人兼首席执行官黄仁勋给全球观众带来了众多的精彩发布!这些发布旨在将过去十年所有的创新结合在一起,其中包括人工智能、虚拟世界、加速、模拟、协作等创新与技术。黄仁勋表示:“计算机图形学和 AI 密不可分,图形学需要 AI,AI 也需要图形学。”他解释说,AI 将在虚拟世界中学习技能,于此同时,AI 也可以用于创建虚拟世界。

黄仁勋SIGGRAPH2023主题演讲

一、迎接生成式 AI 的时代

新一代 GH200 Grace Hopper 超级芯片平台

全球首款 HBM3e 处理器提供突破性的内存和带宽;能够连接多个 GPU 以实现卓越的性能;采用易于扩展的服务器设计。

黄仁勋表示:“为了满足对生成式 AI 不断激增的需求,数据中心需要能够满足特定需求的加速计算平台。全新 GH200 Grace Hopper 超级芯片平台以出色的内存技术和带宽,提高了吞吐量,在不影响性能的情况下可连接多 GPU 以整合性能,并且具有可以轻松部署到整个数据中心的服务器设计。”

GH200-Grace-Hopper超级芯片平台

NVIDIA 与全球工作站厂商共同推出用于生成式 AI、LLM 开发、内容创作和数据科学的系统

NVIDIA 与全球工作站厂商发布性能强大的全新 NVIDIA RTX™ 工作站,专为生成式 AI 和数字化时代的开发与内容创作打造。另外,NVIDIA 发布了三款全新台式工作站 Ada 架构 GPU——NVIDIA RTX 5000、RTX 4500 和 RTX 4000,为全球专业人士带来最新的 AI、图形和实时渲染技术。

NVIDIA 专业可视化副总裁 Bob Pette 表示:“有一些工作负载十分具有挑战性,例如需要使用全栈计算方案的生成式 AI 和数字化应用。借助 NVIDIA 赋能的最新 RTX 工作站,专业人士现在可以在台式机上运行这些应用,在新到来的生成式 AI 时代构建出庞大的数字化世界。”

提升台式工作站的性能

NVIDIA 与 Hugging Face 将连接数百万开发者与生成式 AI 超级计算

NVIDIA 与 Hugging Face 宣布建立合作伙伴关系,为数百万开发者提供生成式 AI 超级计算服务,帮助他们构建大语言模型(LLM)和其他高级 AI 应用。

NVIDIA 创始人兼首席执行官黄仁勋表示:“研究人员和开发者是正在改变每个行业的生成式 AI 的核心力量。Hugging Face 与 NVIDIA 正在将全球最大的 AI 社区与 NVIDIA 在全球领先云环境中的 AI 计算平台相连接。通过双方的合作,Hugging Face 社区用户只需要点击一下鼠标,就可以使用 NVIDIA AI 计算。”

NVIDIA与HuggingFace宣布建立合作伙伴关系

NVIDIA AI Workbench 助力全球企业加速采用自定义生成式 AI

NVIDIA AI Workbench 是个统一、易于使用的工具套件,NVIDIA 发布 NVIDIA AI Workbench。这个统一、易于使用的工具套件使开发者能够在 PC 或工作站上快速创建、测试和自定义预训练的生成式 AI 模型,然后将这些模型扩展到几乎任何数据中心、公有云或 NVIDIA DGX™ 云。

NVIDIA 企业计算副总裁 Manuvir Das 表示:“全球各地的企业都在竞相寻找合适的基础设施并构建生成式 AI 模型和应用。NVIDIA AI Workbench 为跨组织团队创建基于 AI 的应用提供了一条简化的途径,而这些应用正日益成为现代商业的关键。”

助力全球企业加速采用自定义生成式AI

二、推动工业数字化发展

NVIDIA 与全球数据中心系统制造商大力推动 AI 与工业数字化的发展

NVIDIA 宣布推出搭载全新 NVIDIA® L40S GPU 的 NVIDIA OVX™ 服务器。这款功能强大的通用数据中心处理器将通过 NVIDIA Omniverse™ 平台,加速计算密集型的复杂应用,包括 AI 训练与推理、3D 设计与可视化、视频处理以及工业数字化等。

NVIDIA 专业可视化副总裁 Bob Pette 表示:“生成式 AI 为各行各业都带来了变革,企业也更需要为数据中心寻求大规模计算资源。配备 NVIDIA L40S GPU 的 OVX 系统能够加速 AI、图形和视频处理工作负载,满足不断增加的复杂且多样的应用对性能的严苛要求。”

AI 与工业数字化的发展

三、Omniverse元宇宙平台

NVIDIA Omniverse 开启通往 OpenUSD 广阔天地的大门

NVIDIA 宣布将为开发者和企业提供一系列框架、资源和服务,以加速通用场景描述(即 OpenUSD)的采用。NVIDIA 正在通过 NVIDIA Omniverse™ 与新的技术组合、ChatUSD 和 RunUSD 等云应用编程接口(API)以及全新 NVIDIA OpenUSD 开发者计划来推进 OpenUSD 的发展。OpenUSD 是一个 3D 框架,可实现软件工具与数据类型之间的互通,从而构建虚拟世界。

黄仁勋表示:“正如 HTML 点燃了 2D 互联网的重大计算革命,OpenUSD 也将开启协作式 3D 和工业数字化的时代。NVIDIA 通过开发 NVIDIA Omniverse 和生成式 AI ,正在全力推动 OpenUSD 的发展和应用。”

帮助开发者采用OpenUSD

NVIDIA 发布支持生成式 AI 与 OpenUSD 的重大 Omniverse 升级

NVIDIA 发布 NVIDIA Omniverse™ 平台的重要版本更新,为开发者和工业企业提供全新的基础应用和服务,助力其使用 OpenUSD 框架和生成式 AI 来优化并强化其 3D 工作流程。

NVIDIA Omniverse 与模拟技术副总裁 Rev Lebaredian 表示:“工业企业正在竞相推动工作流的数字化,这提升了对 OpenUSD 赋能、互联、可互操作的 3D 软件生态的需求。最新的 Omniverse 更新让开发者能够通过 OpenUSD,利用生成式 AI 来强化自身工具,并让企业能够构建更大、更复杂的世界级模拟,以此作为其工业应用的数字测试场。”

支持生成式AI与OpenUSD的重大Omniverse升级

九、数字与言论

1、320年,12位总统,10位皇帝,2个共和国,一份报纸。——世界最古老报纸《维也纳报》对自己历史的总结。该报创刊于1703年8月8日,今年6月30日停刊。

2、生命的行为目的,不是为了食物和能量,而是为了负熵,争取负熵最大化。熵代表衰老和死亡,那么负熵就代表对抗衰老和死亡。——维基百科《熵与生命》

3、低生育率的本质原因是劳动报酬已经不足以支撑劳动力的再生产。——Bilibili

4、跟大家想的不一样,编程并不需要掌握深刻的思想,而是需要某种程度上记住文档,以便用某些固定词汇,清晰表达我们的想法。——《编程需要知识的广度》

5、以前是我们学习计算机的语言,以后是让计算机学习我们的语言。——Stephen Wolfram,著名计算机学家

6、科学研究最重要的行为准则之一,就是“不要相信权威的话”。他们太多的论点被证明是错误的,权威必须像其他人一样证明他们的论点。—— 卡尔·萨根,美国著名科普作家

7、AI 模型需要用户清晰描述他的问题,但是当代社会有一半人的表达能力不够好,无法从 AI 模型得到理想的结果。—— 《AI:60年来第一个新的 UI 范式》

8、以后有了 AI,用户不再告诉计算机该做什么,而是告诉计算机他们想要什么结果。UI设计将要大变,以后的 UI 范式将基于用户意图。—— 《AI:60年来第一个新的 UI 范式》

9、事情几乎总是从某个人做一些当时看起来毫无用处的事情开始的。——詹姆斯·伯克,英国科技史家

10、哈佛大学的 GPA,20世纪上半叶一直稳定在2.5左右,1960年攀升至3.0,今天已经涨到3.8了。有人说,这是因为今天的学生比以前的聪明。不是的,真正原因是老师降低了标准。现在的学费非常昂贵,大学需要讨好学生,从而导致了成绩膨胀。——《成绩膨胀》

11、你需要养成的一个好习惯,就是强迫自己去做困难的事情。随着你做的事情越来越困难,你会逐渐建立起对自己能力的自信。——《证明你可以做困难的事情》

12、很多成功的艺术家,不是因为模仿某种风格而成功,恰恰相反,他们不顾一切地做自己想做的事情,直到建立了自己独特的风格。——《永远不要浪费你的中年危机》

13、互联网很可能建立在废弃原则之上:一个好用的新事物出现,同类的现有事物很快就会被废弃。—— 《Threads 能替代 Twitter,只是不适合你》

14、点击维基百科条目的第一个链接,不断重复该过程,最终几乎一定会点击到“哲学”条目。据统计,维基百科97%的文章都是如此。——维基百科

Copyright © yoyo all right reserved,powered by Gitbook该文件修订时间: 2023-09-29 18:04:23

results matching ""

    No results matching ""