学习日志(2025-4-21)
Created|Updated|Study Blogs
|Post Views:
今天基本上一直在写 Math 475 的 midterm 2,然后看了 UCSD 的 CSE 234 的 required reading 1.1,一本挺不错的电子书,哈佛的一本开源书,笑死了,而且还找到了一处笔误,在我的 notes:mlsysbook 里有写,之后用空可以提个 PR。感觉现在我能做的贡献全是这样的校对工作,虽然感觉没什么太大创造力,但感觉还是又一些意义。
Math 475 的 midterm 2 才写到第六题,但如果按照计划我应该给他写完,还有满打满算 5 个小时,加把劲!
晚上睡觉前也把 Stat 333 的 thesis statement 给交了,虽然基本不用时间。
Author: Stanley Zheng
Copyright Notice: All articles on this blog are licensed under CC BY-NC-SA 4.0 unless otherwise stated.
Related Articles
2025-04-14
Coding Diary(2025-4-14)
今天打算开始熟悉 SGLang,配置环境的过程果然出现问题了,就先记录一下。 Install from the source 的最后一步: (sglang-dev) zhengbowen@MacBookPro sglang % pip install -e "python[all]" --find-links https://flashinfer.ai/whl/cu124/torch2.5/flashinfer-python 出现了问题。 报错如下: INFO: pip is looking at multiple versions of sglang[srt] to determine which version is compatible with other requirements. This could take a while.ERROR: Could not find a version that satisfies the requirement sgl-kernel==0.0.8.post3; extra ==...
2025-04-24
Coding Diary(2025-4-24)
最近这两天也算搞了点有意思的,除了不想学习,其他干啥都有意思,笑死了。 走通了怎么在 Mac 上用虚拟机装 NAS,不得不说还是有点成就感的,就是这个公网确实是有点烦躁,搞不出公网访问,看看周末有没有时间再搞一搞。 我用的是飞牛的系统,不得不说作为一个开源的系统确实是看上去很不错,很简单,能直接用。相关的具体流程,包括踩了什么坑之类的打算开一个 NAS 相关的文档去写,这里就不写了。 除了 NAS,今天也算是把我这个 blog 网站的搜索功能加上了,用的本地搜索,搜索速度还是很快的。 这两天尽量把那个 intern 的自动测试给整出来,总是不想做,😮💨。
2025-04-29
Coding Diary(2025-4-29)
继续我的 docker。 之前遇到一个报错: Error: Failed to launch the browser process! undefined[579:579:0430/015358.567760:ERROR:zygote_host_impl_linux.cc(105)] Running as root without --no-sandbox is not supported. See https://crbug.com/638180.TROUBLESHOOTING: https://pptr.dev/troubleshooting ❯ ChildProcess.onClose node_modules/@puppeteer/browsers/src/launch.ts:507:11⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯[1/1]⎯ Test Files 1 failed (1) ...
2025-06-19
Coding Diary(2025-6-19)
这一周可以说是过的飞快,真是学到了点东西,模型的训练也开始了。 系统方面的话,SGLang 还是基本没什么进展,但是对我们现在用的这个 music transformer 的架构是大致了解了。我们 mentor 现在是让我们从算子的结构画一个模型图出来,目前还没倒出空来干。 模型方面进展挺多的,处理了我们的新的、巨大的 dataset:Aria。现在用的是最简单的分离 melody 和 accompaniment 的方法,之后可能会试一试别的,比如 skyline。在最简单的分离方法得到的数据集上,我们已经训练了两轮模型了,一个没有 interleave_pos 这个参数,另外一个有。这个参数差不多意思就是序列交错,就是一个 acc 和 一个 mel 是交错的,有这个参数就是相当于告诉了模型这个数据训练的时候是交错的。 之所以这个系统方向进展比较缓慢,就在于我们都得首先熟悉模型,要不然系统也做不了。其次就是训练的时候遇到了一些问题,调了很久训练参数。再就是有一些工具的安装,比如说这个...
2025-06-12
Coding Diary(2025-6-12)
Issue 1: pip install/module not found Basically, I am trying to set up the music transformer model. When we run pip install -r requirements.txt We encounter the error But we just ignore. Then, when we run this command python extract_mid.py We encountered this error And if you try to solve it with pip install mido, you may not solve it. This is because the pip you are using is not the pip in your virtual environment. Actually, if you use venv, you don’t have pip, instead, you have pip3. So,...
2025-07-08
Coding Diary(2025-7-8)
又是好久没写了,训练模型训的确实是非常头痛啊,在这里做一些版本描述,虽然理论上 yaml 里面都是有描述,但是毕竟如果你要一个一个点开看太麻烦了。 1.0.18,1.1.5,1.3.9 这几个都是为了 catch loss jump 训练的。
Comments
GiscusUtterances
Stanley Zheng
Hi, I am Stanley. I am currently a CS student in the University of Wisconsin-Madison.
Follow MeAnnouncement
This is my Blog
Recent Posts