生活日志(2025-5-7)
Final Week 了,最近可以说是非常忙碌了。回国的机票都买完了,要坐将近两天飞机,感觉也是蛮离谱的。CS 525 也考完了,感觉应该还行,应该可以拿 A。CS 475 和 STAT 333 就剩一个尾巴了,所以只剩一个复习 354 了,希望问题不大,还没开始复习,笑死了,感觉东西还是挺多的。 不过今天心情还蛮不错的,有点好消息。除了这些考试都要考完了,我非常久之前申请的暑期的线上 TA 实习也终于有消息了,还以为直接无了,现在至少是第一候选人了。MBZUAI 也终于回复我了一个邮件,说明一切应该都还在 in process,但是快 20 天才回也是怪离谱的。CS 354 的 PM 也面试完了,整整面试了一个小时,也是比较抽象了,我记得这个时间也是最后一个可选的时间段,可能会很快出结果吧,跟 instructor 还是挺熟的,希望能有好的结果🙏。 加油了,也不知道一天够不够复习的,感觉够呛啊哈哈哈哈哈哈,又要焦虑了,毕竟一个 quiz 就能写很久。 最近还一直在看组 nas 或者组 GPU,回家之后打算先把我的 Mac mini 小主机用上,组一个 nas...
Coding Diary(2025-4-29)
继续我的 docker。 之前遇到一个报错: Error: Failed to launch the browser process! undefined[579:579:0430/015358.567760:ERROR:zygote_host_impl_linux.cc(105)] Running as root without --no-sandbox is not supported. See https://crbug.com/638180.TROUBLESHOOTING: https://pptr.dev/troubleshooting ❯ ChildProcess.onClose node_modules/@puppeteer/browsers/src/launch.ts:507:11⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯[1/1]⎯ Test Files 1 failed (1) ...
读书笔记---AI System(1)
这本书发现的也算,比较曲折,是看到有一个人写的一篇知乎里推荐了一位博主吧,叫 ZOMI酱。虽然是在知乎发现的,但是他基本上是一个视频博主,所以B站看的话更方便,看了一个介绍视频之后发现了他这个AISys的开源书,发现直接看书也可以。目前感觉还是不错的。 AI 系统概述 这个 chapter 里面就全是介绍,感觉没啥说的,但反正读起来还算很顺,我觉得这种教科书性质的读起来很顺就很可以了。但如果你完全没有任何背景知识的话,估计读完就读完了,也不会有什么感受,如果你有一些背景知识的话,就算是帮你梳理一下体系。 AI 硬件体系结构 AI 计算体系概述 AI 计算模式 这里遇到了一些以前不知道的知识。 模型量化和网络剪枝,这两个技术都是为了解决模型太大,占用的内存太多的问题。 模型量化还有两种,非对称量化和对称量化。 量化 将浮点数(如 FP32)映射为整数(如 INT8、UINT8),以减小模型体积、加速推理。 对称量化(Symmetric Quantization) 概念 假设数据以 0 为中心对称分布 映射到整数范围 [-128,...
Coding Diary(2025-4-24)
最近这两天也算搞了点有意思的,除了不想学习,其他干啥都有意思,笑死了。 走通了怎么在 Mac 上用虚拟机装 NAS,不得不说还是有点成就感的,就是这个公网确实是有点烦躁,搞不出公网访问,看看周末有没有时间再搞一搞。 我用的是飞牛的系统,不得不说作为一个开源的系统确实是看上去很不错,很简单,能直接用。相关的具体流程,包括踩了什么坑之类的打算开一个 NAS 相关的文档去写,这里就不写了。 除了 NAS,今天也算是把我这个 blog 网站的搜索功能加上了,用的本地搜索,搜索速度还是很快的。 这两天尽量把那个 intern 的自动测试给整出来,总是不想做,😮💨。
Coding Diary(2025-4-14)
今天打算开始熟悉 SGLang,配置环境的过程果然出现问题了,就先记录一下。 Install from the source 的最后一步: (sglang-dev) zhengbowen@MacBookPro sglang % pip install -e "python[all]" --find-links https://flashinfer.ai/whl/cu124/torch2.5/flashinfer-python 出现了问题。 报错如下: INFO: pip is looking at multiple versions of sglang[srt] to determine which version is compatible with other requirements. This could take a while.ERROR: Could not find a version that satisfies the requirement sgl-kernel==0.0.8.post3; extra ==...
主流 AI 实际使用体验(组合学答题方面)
进入到了 2025 年,各家的 AI 模型可以说已经是强到不像话了,尤其是 DeepSeek 发布自己的模型之后,各家更是都要卷飞了,尤其是各个大厂,不仅卷性能,卷价格,使用体验上也可以说是卷飞了,正好最近高强度使用了 Google Gemini 2.5 Pro、DeepSeek R1(官网版本)和 ChatGPT o3,浅浅的评测一下。需要注意的是测试时间是 2025.4.22,模型性能可能会根据时间的不同而变化,所以这个评测结果是有时效性的。 整体使用体验 整体的使用体验,我觉得是 Google Gemini 2.5 Pro > ChatGPT o3 > DeepSeek R1。 UI UI 上 Gemini 和 ChatGPT 是真的有打磨的很好,但是 DeepSeek 就很粗糙了,但是这也很正常,毕竟 DeepSeek 这个官网模型就相当于是一个“样板间”一样的东西,甚至也没有收费这一说。 生成速度 生成速度方面 Google Gemini 2.5 Pro 一骑绝尘,真的太快了,ChatGPT o3 也可以接受,但是 DeepSeek...
学习日志(2025-4-21)
今天基本上一直在写 Math 475 的 midterm 2,然后看了 UCSD 的 CSE 234 的 required reading 1.1,一本挺不错的电子书,哈佛的一本开源书,笑死了,而且还找到了一处笔误,在我的 notes:mlsysbook 里有写,之后用空可以提个 PR。感觉现在我能做的贡献全是这样的校对工作,虽然感觉没什么太大创造力,但感觉还是又一些意义。 Math 475 的 midterm 2 才写到第六题,但如果按照计划我应该给他写完,还有满打满算 5 个小时,加把劲! 晚上睡觉前也把 Stat 333 的 thesis statement 给交了,虽然基本不用时间。
学习日志(2025-4-20)
今天上午踢了个球,基本上剩下的时间都在写这个 CS 525 的 HW5,写的真是头晕脑胀的,但不得不说感觉一些概念稍微清晰了一些,本来还打算读一读 UCSD 的 CSE 234 的 required reading,但感觉确实是学不动了。 本来踢完球应该洗个澡,但是当时想着晚上稍微早点回来,然后洗澡睡觉,但是被 Kan 拖住了,一直在图书馆。不得不说又发现了一个好地方,memorial library 的 computer lab,全是很好的显示器,晚上还没人,还里 domain 或者 route A bus stop 近,天选自习室。哎,啥时候国内也能有这样子的地方就太好了。 STAT 333 的 HW4 扣了 40 分,足足 40%,因为直接少了一块 visualization 的部分,下次在写这个作业我一定要小心,仔细读好要求。 感觉还是挺充实的,但是我的 intern 又没时间搞了,明天还要写 Math 475 的 take-home midterm 2,这个也是非常离谱的大作业,要花很长时间去慢慢做。 哎,情感上又遇到了大挫折,不过这是学习日志,就不在这里写了。
学习日志(2025-4-19)
今天又是充实的一天,把 UCSD 的 CSE 234 第一周的 slides 和 recording 看完了,不过 required reading 还没看,如果可以的话今天或者明天给他看完。不得不说 Hao 老师讲话真快,看过很多课的 recording 感觉这是唯一一个我看了没有一点开倍速欲望,甚至还有减速欲望的。 还有重温了一下 LSTM,之前只看过 LSTM 的论文,或者只看过李沐讲 LSTM,确实没看过 llya 在 NIPS 2014 上的 talk,很短,但还是挺 impresive 的。llya 的口音真是很神奇,就他说的非常流畅,也很清楚,而且甚至似乎还有点好听。