2023.04-06--第12期

一、刊首图

新疆克拉玛依拍摄到极光

4月24日,摄影师“@Jeff的星空之旅”在新疆克拉玛依拍摄到极光。当天,太阳发生了剧烈的日冕物质抛射,引发了地球近20年来最大一次地磁暴。

二、时事新闻

1、ChatGPT亚洲大面积限制访问及封号

OpenAI官方从2023年3月30号开始大面积封号,禁止使用亚洲节点登录,有网友还曝出OpenAI已经暂停注册新账号。有分析认为,此前出现封号可能是账号为批量注册、出现API滥用情况或访问量过大造成的技术问题所致。(我的账号还没被封,这里放一张被封号的网图,封号是永久的,即便开通了付费Plus也没用)

为了防止被封号,近期尽量不要登录与使用(那种购买的批量注册账号,邮箱权重很低,相对更容易被封号)。如果非要用的话,开全局代理,用无痕模式,选美国节点,不要使用中文,不要请求的太频繁。

ChatGPT封号

有很多机场节点和搬瓦工VPS自建节点的IP也被限制访问了。如果你出现了这个情况,就换节点,节点一个一个试,原因是OpenAl封了你现在使用的这个节点的IP,但账号还没有被封。

2、热成像攻击

美国加州大学的研究人员,最近演示了热成像攻击。它的原理是,人体触摸一个物体以后,热量会短暂地保留在物体表面,在热像仪下可以看。用户在键盘输入密码20秒内,研究人员使用热像仪,可以93%的准确率猜出了平均长度8个字符的密码,70%的准确率猜出16字符的密码。即使按键一分钟后,也有62%的概率可以猜出密码。研究人员认为,终极的解决方法就是放弃按钮密码。

3、海上光伏发电平台

中国首个海上漂浮的半潜式光伏发电平台,近日在烟台海域交付。这个平台由4块巨大的光伏板组成,每块光伏板接近一个篮球场的大小,总面积达到1900平方米,峰值发电量为 400kw。它漂浮在水面上,进行太阳能发电。

海上光伏发电平台

4、ChatGPT 官方 iOS APP 已上线

2023.5.19,ChatGPT 官方 iOS APP 已上线,可以直接App Store充值ChatGPT Plus了,解决了付费难的问题。用美区Apple ID可以下载,国区商店里搜不到,网页版本的历史记录也是同步的,可以随时查看。使用时需要开着代理,不然无法访问,由于用的还是自己的 ChatGPT 账号,为了防止被封号,还是建议不要用亚洲节点。

ChatGPT的官方IOS-APP

5、英特尔发布全新架构 x86S

英特尔发布了一个新的 CPU 指令集 x86S,只支持64位模式,可以简化 CPU 的设计。

Intel发布x86S架构

6、苹果发布首款头显Vision Pro

苹果发布了首款头显Vision Pro登场,售价3499美元,约合人民币24850元。虽然被定位为AR设备,但在苹果看来,Vision Pro完全可以看作一个无缝融合现实世界和电子世界的新型计算机。库克直接放话:正如iPhone带我们进入移动计算时代,Apple Vision Pro将带我们进入空间计算时代。

Vision-Pro

7、全球首架载人“飞碟”在深圳起飞

世界首架载人飞碟,6月3日在深圳正式起飞。这架飞碟是电动的,最大飞行高度200米,续航时间15分钟。

载人飞碟

三、技术文章

1、如何在 AWS 租用 GPU(中文)

自己玩 AI 模型,算力和资金是一个大问题,一般都要租用云服务商的 GPU。作者尝试了各家服务商,这是在 AWS 租 GPU 的详细流程。

2、Midjourney 5.1 更新(中文)

最新V5.1在人物细节处理更加精准,颜色更加生动了,下图是“中国完美情侣”的生成效果。

Midjourney5.1更新-效果示例

3、.dev 域名的限制(英文)

作者讲述遇到的一个奇怪问题,最后发现原因是使用了 .dev 域名。该域名由谷歌管理,谷歌硬性规定,所有 .dev 域名只能用 HTTPS 协议访问。谷歌管理的其他域名 .app、.day、.dev、.page 和 .new 都是如此。

4、如何制作 GitHub 个人主页(英文)

本文演示 GitHub 个人主页如何定制,并且使用脚本,通过 GitHub Actions 定期更新。

5、人工智能发现排序算法(中文)

谷歌人工智能部门 DeepMind 宣布,使用 AI 发现了一种新的算法 AlphaDev,把排序速度提高了 70%。

十多年来,C++ 排序库首次更改。AI 优化世界代码,又达新里程碑。目前,最新研究已登上 Nature。

人工智能发现排序算法

四、开源组件

1、the-algorithm

Twitter 推荐算法是一组服务和作业,负责构建和服务主页时间线。有关算法工作原理的介绍,请参阅 工程博客,下图说明了主要服务和作业如何互连。

the-algorithm

2、audioFlux

audioFlux基于数据流设计。将各个算法模块在结构上解耦,可以快速高效地提取多维特征。下面是主要功能架构图。

audioFlux

3、Auto-GPT

Auto-GPT 是一个实验性开源应用程序,展示了 GPT-4 语言模型的功能。该程序由 GPT-4 驱动,将 LLM 的“思想”链接在一起,以自主实现您设定的任何目标。作为 GPT-4 完全自主运行的首批示例之一,Auto-GPT 突破了 AI 的可能性界限。

4、DeepSpeed

DeepSpeed 是一个由微软开源的深度学习优化库,它使分布式训练和推理变得简单、高效和有效。DeepSpeed 只需单击一下即可启用类似 ChatGPT 的模型训练,提供比 SOTA RLHF 系统快 15 倍的速度,并在所有规模上实现前所未有的成本降低。官方还提供了示例:DeepSpeedExamples

5、milvus

Milvus 是一款全球领先的开源向量数据库,赋能AI 应用和向量相似度搜索,加速非结构化数据检索。 用户在任何部署环境中均可获得始终如一的用户体验。 Milvus 2.0 是一款云原生向量数据库,采用存储与计算分离的架构设计。 该重构版本的所有组件均为无状态组件,极大地增强了系统弹性和灵活性。

Milvus工作流程

6、oshi

获取操作系统和硬件信息的 Java 库。这是一个基于 JNA 实现的获取本机操作系统和硬件信息的库,支持操作系统版本、进程、内存、 CPU 使用率、磁盘和分区、设备、传感器等信息。

7、segment-anything

分割一切的图像分割模型。它是来自 Meta AI 研究院的图像分割模型,只需一键就可以“切出”图像中的任何对象。它在 1100 万张图像和 11 亿个掩码的数据集上完成了训练,能够在各种分割任务上具有很强的零样本性能。

segment-anything

8、AnimatedDrawings

这是 Meta AI 研究院开源的动画库,它能让你的画作动起来。无论是小朋友画的小人,还是高水平的卡通人物,该项目都能让它们跟着你一起做动作。

9、PyQt-Fluent-Widgets

Python 图形界面框架 PyQt5 的组件库。如果使用的是 PySide2、PySide6、PyQt6,去对应分支拉取代码。

PyQt-Fluent-Widgets

10、stitching

一个 Python 软件包,用于将多幅照片合成一幅。

stitching

11、langchain

LangChain是一个开源的框架,它可以让AI开发人员把像GPT-4这样的大型语言模型(LLM)和外部数据结合起来,它提供了Python或JavaScript的包。

ChatGPT模型是用到2021年的数据训练的,这可能会有很大的局限性。虽然这些模型的通用知识很棒,但是如果能让它们连接到自定义的数据和计算,就会有更多的可能性,这就是LangChain做的事情。

简单来说,它可以让你的LLM在回答问题时参考整个数据库。所以你现在可以让你的GPT模型访问最新的数据,比如报告、文档和网站信息。

五、工具软件

1、MochiDiffusion(开源)

在 Mac 上原生运行 Stable Diffusion,需要转换或下载 Core ML 模型才能使用 Mochi Diffusion。

MochiDiffusion

2、Tune-A-Video(开源)

文本到视频生成的图像扩散模型的一次调优,简单来说,现在你可以输入一段文字来获得一段视频了。

3、VideoCrafter(开源)

用于文本到视频生成和编辑的工具包。

4、chatbox(开源)

开源的 ChatGPT 桌面应用,支持 Windows、macOS、Linux 等主流操作系统,下载安装包即可使用。

chatbox

5、visual-chatgpt(开源)

微软开源的项目,Visual ChatGPT 是在大量文本和图像数据集上训练的。该模型使用不同的视觉基础模型(如VGG、ResNet和DenseNet)从图像中提取特征,然后将这些特征与基于文本的输入相结合以生成响应。 使用有监督和无监督学习技术的组合进行训练,使其能够学习并适应新的场景。

6、ai-code-translator(开源)

使用 ChatGPT 将代码从一种语言翻译成另一种语言。官方体验

ai-code-translator

7、cloudflare-proxy(开源)

Cloudflare Worker 代理请求 ChatGPT API,支持 Stream 流式输出。

8、chatgpt-i18n(开源)

借助 ChatGPT,翻译 i18n 的 JSON 文件,只需数十秒即可完成多语言国际化。

chatgpt-i18n

9、Alpaca-Turbo(开源)

Alpaca-Turbo 是一种无需太多设置即可在本地运行的语言模型。它是基于 LLaMA 的 alpaca.cpp 语言模型的用户友好 Web UI,具有使其从其他实现中脱颖而出的独特功能。目标是在不牺牲速度或功能的情况下提供易于配置和使用的无缝聊天体验。

10、alpaca.cpp(开源)

笔记本本地运行体验类ChatGPT的Alpaca-7B/13B大模型。

  • 该模型基于斯坦福Alpaca-7B、13B大模型进行量化后进行封装,实现常见笔记本配置下体验大模型的效果。
  • 加载模型仅需4G左右内存(7B版本),且语句生成速度很快。

模型权重文件:

文件名 文件大小 参数量 占用内存 网盘地址
ggml-alpaca-7b-q4.bin 4.2G 7B 4G+ Alpaca-7B
ggml-alpaca-13b-q4.bin 8.1G 13B 8G+ Alpaca-13B

alpaca.cpp效果

11、LlamaChat(开源)

LlamaChat是一款 macOS 应用程序,可让您与 LLaMAAlpacaGPT4All 模型聊天,这些模型都在您的 Mac 上本地运行。

12、EasyFind(非官方中文版)

一款运行在Mac平台上的文件搜索工具,它能够根据名称或者文件格式来帮助用户搜索需要的文件和文件夹,搜索速度非常快,相当于Mac版的Everything。

EasyFind

13、OmniDiskSweeper(免费)

可以层次化从大到小显示磁盘上的文件,可以快速找到不需要的大文件并将它们清除到垃圾箱,用于磁盘清理。

OmniDiskSweeper

14、Bartender 4(破解)

Macbook Pro 很多都是刘海屏设计,如果开的应用过多,会遮挡住应用图标,非常不便。Bartender 4工具可以自行管理有哪些软件图标放置在主菜单,其余的都默认隐藏(悬浮可查看)。

Bartender4

15、cat-catch(开源)

一个浏览器插件,用于资源嗅探扩展,能够帮你筛选列出当前页面的资源。Chrome插件商店

16、SourceTree(免费)

适用于 Windows 和 Mac 的免费 Git 客户端。Sourcetree 简化了您与 Git 存储库的交互方式,因此您可以专注于编码。通过 Sourcetree 的简单 Git GUI 可视化和管理您的存储库。

SourceTree

17、Monica(免费)

一个Chrome插件。Monica使用ChatGPT的强大功能来理解和响应您的聊天消息,只需按下Command+M或Ctrl+M即可在任意网页中唤出。不需要提供自己的ChatGPT API,可以白嫖使用(免费版每天30次)

Monica

18、nali(开源)

一个查询IP地理信息和CDN服务提供商的离线终端工具。

19、domain-admin(开源)

开源的 SSL 证书监控平台,证书到期自动发邮件提醒,支持 Docker 部署。

domain-admin

20、cheetah(开源)

这个工具用于远程面试,它会把面试官的提问自动转成文字(Whisper 模型),传给 OpenAI,然后将结果显示在你的屏幕上。

cheetah

21、docker-rollout(开源)

这个工具可以不停机更新 Docker Compose 里面的某个服务。原理是同时新建两个实例,用已更新的实例替换未更新的实例。

22、create-chart(开源)

基于Echarts的可视化数据大屏设计器(包含设计、预览、分享等全部流程)。官方体验

create-chart

23、wails(开源)

用来写跨平台桌面应用的 Go 框架,可以替代 Electron。跟 Tauri 的作用类似,不同的是 Tauri 基于 Rust 语言,它基于 Go。

24、gpt4free(开源)

提供逆向工程的第三方API ,支持GPT-4/3.5,这些模块被设计成像 OpenAI 的官方包一样使用。

25、law-cn-ai (开源)

作者将中国法律法规喂给 ChatGPT,做成的法律问答引擎。AI法律助手

AI法律助手

26、ImageMagick(开源)

一款强大的编辑和处理图像的桌面工具。该项目可用于创建、调整大小、裁剪、颜色校正和合成图像,支持超过 200 种的图像文件格式,其强大之处在于提供了处理复杂图像处理任务的 CLI 和 API。ImageMagick 被广泛应用于平面设计、科学研究、医学影像、天文等领域,适用于 Windows、Linux 和 macOS 系统。

27、krita(开源)

自由开源的免费绘画软件。它强大且完全免费,无需注册、没有广告、试用期和商用限制,让每一位画师都可以有尊严地进行创作。可用于绘制概念草图、插画、漫画、动画、接景和 3D 贴图,支持数位板、压感、防抖、图层、滤镜、色彩管理等功能,适用于 Windows、Linux、macOS 操作系统。

28、scrutiny(开源)

一款监控硬盘运行状况的仪表板。这是 smartd 的 WebUI 平台,smartd 是一个守护进程,它能够监视拥有 S.M.A.R.T.(自我监测、分析及报告技术) 规范的硬盘。该项目基于 smartd 实现了硬盘各项指标的可视化界面,并增加了告警、自定义阈值等功能。

scrutiny

29、dperf(开源)

一款能模拟巨大流量的压测工具。该项目是基于 DPDK 开发的高性能压测工具,能够每秒建立千万级的 HTTP 连接、亿级别的并发请求和数百 Gbps 的吞吐量。

30、kwok(开源)

模拟 K8s 集群的工具。它可以在几秒钟内搭建一个由数千个节点组成的 Kubernetes 集群,整个过程仅占用非常少的资源,轻松实现在本机上学习、测试和开发 K8s 集群应用。

31、SwitchHosts(开源)

SwitchHosts是一款MacOS端管理hosts文件的工具。

32、lx-music-desktop(开源)

一个基于 Electron + Vue 开发的免费听歌软件。支持在Windows、 Mac OS、 Linux、 Android平台上运行,不计划支持IOS。

lx-music-desktop

33、ChatLLM-Web(开源)

开源的浏览器 LLM 模型,只要访问部署网页,就能使用,所有数据都在本地训练。官方体验

注意,用户需要满足三个使用条件。

  • Chrome 113 以上浏览器。
  • 下载训练数据约 4GB(只需下载一次)。
  • 显卡最好有 6.4GB 以上显存

ChatLLM-Web

34、AI工具网址导航站(免费)

一个收集性质的 AI 工具导航网站。

AI工具网址导航站

35、open-chat-video-editor(开源)

一个开源的短视频自动生成工具。

36、Convoy(开源)

开源的 Webhooks 网关,自带管理后台,具有重试、速率限制、静态 IP、熔断等大量功能。

Convoy

37、Tails(免费)

一个融合了 Debian 和 Tor 的操作系统,放到 U 盘里面,插入 USB 接口就能用,可以很好地保护隐私。

38、Git-Sim(免费)

一个命令行工具,可以生成图片或动画,显示某个 Git 命令对当前仓库的影响。

git-sim

39、Read Something(开源)

一个开源的 Chrome 插件,可以将网页转成阅读模式,并且内置了 AI 总结、翻译、Mardown 转换等功能

40、linux-wifi-hotspot(开源)

功能丰富的 Linux WiFi 热点工具。这是一款拥有图形化操作界面的 Wi-Fi 创建器,它使用方便、功能丰富,支持命令行、创建 VPN 热点、二维码分享网络、查看已连接设备等功能。

linux-wifi-hotspot

41、progress(开源)

查看 Linux 命令执行进度的工具。这是一个可以查看 cp、mv、dd、tar 等命令执行进度的 Linux 工具,它可以显示已处理数据的百分比、处理速度和预计完成时间,并提供了类似 top 的监控模式。

42、wondertrader(开源)

一站式的量化交易框架。这是采用 C++ 开发的一站式量化交易框架,支持量化交易过程中的数据清洗、回测分析、实盘交易、运营调度等环节。可用于多账户交易、极速/高频交易、算法交易等场景。

wondertrader

43、1Panel(开源)

现代化、开源的 Linux 服务器运维管理面板。这是一款 Go 写的 Linux 服务器的在线管理系统,它安装简单、安全可靠,同时集成了 WordPress 等应用、域名绑定、SSL 证书配置、备份等功能,支持快速建站。

1Panel

44、minikube(开源)

一条命令在本机启动 Kubernetes 集群的工具。一个可以在本地轻松运行 K8s 集群的工具,它支持标准的 Kubernetes 功能,可作为本地开发 Kubernetes 应用程序的工具,适用于 macOS、Linux 和 Windows 操作系统。

45、jetlinks-community(开源)

一个全响应式的企业级物联网平台。基于 Spring Boot 开发的一款开箱即用、可二次开发的企业级物联网基础平台。支持不同设备的统一接入、规则模型配置、数据权限控制等功能。

jetlinks-community

46、EasySpider(开源)

一款可视化爬虫工具。该项目可以让用户在图形化界面下,无需写代码实现自动采集/爬虫的功能。用户只需要在网页上选择想要爬的内容,并根据提示框操作即可完成爬虫的设计和执行。

47、oxipng(开源)

多线程的 PNG 图片压缩工具。这是一个 Rust 写的命令行 PNG 无损压缩工具,支持多线程压缩速度快,还可作为 Rust 库使用。

48、AGiXT(开源)

AGiXT 是一个动态的 AI 自动化平台,可跨不同的 AI 提供商无缝协调指令管理和复杂任务执行。

49、Qbot(开源)

Qbot是一个面向AI的量化投资平台,旨在挖掘潜力,赋能AI技术在量化投资领域。

Qbot

50、gpt-code-ui(开源)

OpenAI 的 ChatGPT 代码解释器的开源实现。

51、Tabby(开源)

GitHub Copilot 的开源替代品,AI 代码助手,可以自己架设,并且离线使用。它还提供 Web 界面,根据指令生成代码。

52、qrbtf(开源)

艺术二维码生成器。在线体验

qrbtf

53、MyMacsAppCrack(开源)

MacBook 软件破解,作者写了很详细的使用指南。

54、ChatGPT-Midjourney(开源)

一键免费部署你的私人 ChatGPT+Midjourney 网页应用(基于ChatGPT-Next-Web开发)。

ChatGPT-Midjourney

55、LongMem(开源)

论文“Augmenting Language Models with Long-Term Memory”的代码实现。论文地址

56、manga-image-translator(开源)

翻译漫画/一键翻译各类图片内文字。

manga-image-translator

57、tensorboard(开源)

TensorBoard是Google开发的模型内部参数跟踪和可视化的调试工具。在Tensorflow中,用TensorBoard可以监控模型的各种指标的变化(如acc、loss的动态变化),可以将模型结构可视化,可以可视化词嵌入空间,可以分析模型性能,可以分析数据集的公平性等等,是一个非常强大且非常简单的工具。

TensorBoard

58、jupyter(开源)

Jupyter Notebook,是一个可以把代码、图像、注释、公式和做图于一体,实现可读性分析的灵活工具。它是用网页访问的,可以在浏览器中编写和执行程序,并且可以在其它机器上远程调用它,可以屏蔽不同系统的显示差异。在分享示例代码的时候,也非常方便,完全不用再去考虑格式的问题。

Jupyter交互式笔记本

59、roop(开源)

一键AI视频换脸的工具,提供可视化操作界面。输入项为人脸图片和视频,输出项为替换人脸特征后的视频。初次执行会自动下载模型,合成视频需要依赖 FFmpeg 环境。处理过程耗时较长,可以先预览任意帧的效果,之后在实际进行处理。

实际使用体验:只能更换真人人脸(动漫的人脸不行),提取了一些人脸关键特征进行替换(不是整个人脸替换过去),内置的检查功能(包括但不限于裸体、图形内容、战争镜头等敏感材料)。

roop

60、jumpserver(开源)

JumpServer 是广受欢迎的开源堡垒机,是符合 4A 规范的专业运维安全审计系统。

JumpServer

六、学习资源

1、LangChain 中文入门教程(中文)

LangChain 是大型语言模型(LLM)的编程框架,这个仓库是网友写的中文教程。

2、dockerlabs(英文)

适合所有阶段开发者的 Docker 教程,该教程的内容分为初、中、高三个级别。

3、机器学习图解(英文)

这个英文网站提供机器学习的图解教程,内容还挺多的。

机器学习图解

4、ai-collection(中文)

生成式AI项目汇总的精选列表。

5、awesome-chatgpt(英文)

这个 Awesome 仓库收集关于 ChatGPT 的各种资源。

6、Awesome-Multimodal-Large-Language-Models(英文)

多模态大型语言模型的最新论文和数据集。

7、hello-algo(中文)

《Hello 算法》是一本动画图解、能运行、可提问的数据结构与算法入门书,支持 Java, C++, Python, Go, JS, TS, C#, Swift, Zig 等语言。在线阅读

hello-algo

8、Spring 中文文档(中文)

网友整理的 Spring 框架中文文档。

9、Docker and Kubernetes 完整开发指南(中文)

Udemy课程的学习笔记,看完可以对 Docker、Docker Compose、Kubernetes 这些技术有了一个基本的了解。

10、提示工程入门(中文)

一本人工智能和提示工程的入门电子书。

提示工程入门

11、tuning_playbook(英文)

深度学习调优指南。该指南出自几位谷歌大脑研究员的深度学习模型调参经验总结,内容包括如何开始新项目、提高模型性能的方法和训练过程中的经验,适合已掌握机器学习基本知识、对优化深度学习模型性能感兴趣的工程师和研究员阅读。

七、生活经验

1、无人机还原古代建筑

一组荷兰艺术家使用无人机,“还原”古代建筑的本来样子。

无人机还原古代建筑

2、长板问题

“长板问题”指的是,问题的关键不在于最弱点,而在于最强点。 只要有一个点特别出色,这件事情就成功了,其他点的好坏无所谓。文艺作品就属于这种情况。你购买了一张专辑,其他的歌曲都不爱听,但是有一首歌你特别喜欢,这张专辑就值得了。电影和小说只要有一个角色或情节特别打动人,作品就成功了。风险投资也是这样,只要投了一个特别成功的项目,就能把所有损失补回来。

人生就是一个“长板问题”。 一生中,失败和挫折其实不重要,多少次都不重要,只要有一次大的成功,人生就成功了。最大的那一次成功,决定了你一生的成就和高度。很多诺贝尔奖得主,一生就做出了一个重要的科学发现,就足够成为伟大科学家了。程序员写过多少代码不重要,只要创造过一个重大影响力的软件,职业生涯就成功了。

我们必须学会区分“短板问题”和“长板问题”,它们的解决方法完全不同。 短板问题的解决,需要盯着薄弱环节,补齐最短的那块板;长板问题的解决,只需要推进最强的环节,不要在乎别的。人生不必在乎那些不重要的事情,没必要为了挫折和拒绝而沮丧,都会过去的。你要做的是向前看,拼命争取一次大的成功,让它足够大、更大,只要一次就够了。

3、地球的结局

最近,天文学家首次观察到,一颗垂死的恒星吞噬掉它的行星。这颗恒星距离地球12,000光年,已经进入了生命周期的晚期,体积急剧膨胀了1000倍以上,变成一颗红巨星,吞噬了靠近它的行星。天文学家认为,地球的结局也是这样。当太阳终结的时候,地球也将随之终结。

地球的结局

4、佛罗里达海滩

一个美国摄影师专门拍摄佛罗里达州的热门海滩,人群和遮阳伞的照片非常惊艳。

佛罗里达海滩

5、自动紧急刹车

美国交通部表示,正考虑让美国所有的轿车,都安装自动紧急刹车装置。一旦前车突然减速,或者前面突然出现行人,该装置会发出警报,并启动刹车。美国交通部的设想是,它以后会像安全带和气囊一样,成为每辆车的标配。这意味着,车辆前部必须加一个传感器,可能是雷达,也可能是摄像头,用来检测前方物体。根据研究,这样每年可以防止24000起车祸,少死360个人。

自动紧急刹车

八、闲情逸趣

黄仁勋的NVIDIA故事

黄仁勋大概是硅谷最有影响力的华人。1993年,他跟两个朋友一起创办了芯片设计公司 NVIDIA,当时是小公司,可现在是美国第五大科技公司(仅次于苹果、微软、谷歌和亚马逊)。十年前,如果你买了 NVIDIA 的股票,它的股价现在上涨了105倍,最近十年美国涨幅第一名的股票就是它。

NVIDIA

黄仁勋突然出现在台湾,被拍到在饶河街夜市买小吃。后来大家才知道,他要参加5月27日的台大毕业典礼,他是今年的演讲嘉宾。这个演讲,网上有全文,原文是英语,已经译成中文。他只讲了20分钟,但是可以解开一个很重要的疑问:NVIDIA 是怎么发家的?

黄仁勋台大毕业典礼演讲

黄仁勋说,为什么要创立 NVIDIA?因为我们看好加速计算。人类对计算速度的要求一定会越来越高,CPU 只能做通用计算,加速计算需要定制的专用硬件,所以我们的创业目标就是加速计算的硬件。市场需求量最大的加速计算硬件,就是游戏的图形芯片(GPU),所以我们选择游戏显卡作为创业产品。我们只做芯片设计,生产全部外包。1994年,我们的第一个客户是日本游戏公司 SEGA,我们为它的游戏主机设计显卡。

SEGA游戏机的NV1显卡

但是第二年,微软发布了 Windows 平台的图形接口 Direct3D。我们一下子就慌了,因为它跟我们的设计是冲突的。我们最终选择中止与 SEGA 的合约,改为为 Windows 平台开发 GPU。这是一步险棋,因为 SEGA 是我们唯一的客户,却被我们踢走了。我们的资金只能支持6个月,如果这点时间里面,拿不出新产品,我们就只有倒闭了。幸运的是,快要没钱的时候,我们设计出了 Riva 128,这块芯片取得了成功。到了1997年底,它的出货量超过100万张,我们就这样活了下来。

RIVA128

我们为 Windows 平台设计显卡,一直干了10年。虽然产品很受欢迎,但是有一个问题:人们只用这些显卡打游戏,无法用于其他的加速计算。 因为那时的 GPU 必须通过 Windows 的接口使用,受制于操作系统,用户无法直接操作 GPU,很难将其用于自己的用途。

为了扩展 GPU 的用途,2007年我们推出了 CUDA 框架,让用户可以操作 GPU 底层接口,定制化编程,满足自己的加速计算需求。GPU 从此可以用于科学运算、物理模拟等各方面。

NVIDIA-CUDA

令人失望的是,市场需求始终不旺,而我们推进 CUDA 的成本非常高。那几年,我们的利润受到严重拖累,股价低迷。内部也出现分歧,有人提出放弃 CUDA。谁能想到,命运的转折点突然出现了。2014年,人们发现 CUDA 能够满足 AI 训练的大量计算,它一下子就变得异常火爆。随着 AI 的快速发展,我们从此走上了康庄大道,股价一飞冲天。

除了 AI,我们也尝试把加速计算推广到其他新兴领域。2007年 iPhone 诞生了,手机芯片成为了一个超级市场,我们开始考虑为安卓手机开发芯片。但是,手机芯片是集成的,CPU、GPU、通信芯片做在一起,如果我们要做安卓芯片,就必须研发通信芯片,这跟我们的加速计算方向是不符合的。我们不得不做出一个艰难的决定:放弃手机市场。为了弥补这个损失,我们选择进军另一个更符合我们的市场:自动驾驶的车用芯片。自动驾驶的计算量非常大,市场也很广阔。

自动驾驶的车用芯片

上面就是 NVIDIA 的简史。回顾这段历史可以看到,只要你坚信自己的大方向是对的,不妨就坚持做下去,不要害怕遇到挫折,也不要被眼前利益诱惑,最终会看到回报,NVIDIA 就是这样走过来的。

九、数字与言论

1、一开始,程序直接在硬件上运行;后来,程序在操作系统上运行;现在,程序在浏览器上运行。——Hacker News

2、任何软件工具都应该遵循一个原则:做对的操作应该很容易,做错的操作应该很难。——《论平台工程》

3、企业家谈成功经验,就好像在说:“我曾经用这些号码,赢得过彩票。”——Twitter用户

4、我离开谷歌,是为了呼吁 AI 的风险,在谷歌任职不方便谈论这些事情。——“深度学习之父”杰弗里·欣顿(Geoffrey Hinton),宣布从谷歌辞职

5、要成为优秀程序员,请编写大量代码;要成为顶级程序员,请阅读大量代码。——《请编写 CRISP 代码》

6、人类已经处于与 AI 共同进化的阶段:AI 影响和感染了我们,然后我们又改进了 AI,让它更像人类。—— Sam Altman,OpenAI 的 CEO

7、创业公司有一个准则,叫做“最小可行产品”,意思是产品只要做到最简单的可运行程度,就可以发布,让市场来检验是否可行。我想提一个相反的概念,叫做“最大可行产品”,意思是产品的主要功能完备以后,就到此为止了,不再添加新功能。我见过太多的优秀软件不断膨胀,功能越来越多,直到变得无比难用。—— 《最大可行产品》

8、一旦你的手机与手机信号塔开始连接,你就没有隐私了。—— 《手机的“位置关闭”开关是一个谎言》

9、1977年上线的计算机系统中,只有两个至今仍在可靠的运行,而且都不在地球。它们就是旅行者1号和2号飞行器,目前都离开了太阳系,飞向宇宙深处。——《是否存在过于可靠的系统?》

10、归根结底,博客、播客、短视频都是一个人表达自己的地方,是他们用数字形式说“这就是我”的方式。—— 《人工智能会扼杀博客吗?》

11、没有权威,证据就是一切。——伦敦皇家学会,1660年成立时选择的座右铭

12、人们依靠机器,希望这能带给他们更多自由,但这只会让拥有机器的人奴役他们。——弗兰克·赫伯特,科幻小说《沙丘》的作者

13、作为管理者,你的角色不是自己完成工作,即使你非常擅长干这些事。你的角色是改善团队目标、团队人员和工作流程,尽可能让团队产生乘数效应,放大你的资源。——Julie Zhuo,Facebook 前产品副总裁

Copyright © yoyo all right reserved,powered by Gitbook该文件修订时间: 2023-06-22 15:57:44

results matching ""

    No results matching ""