Notes---Operating Systems: Three Easy Piece---Persistence(UW-Madison CS 537)
这里就是最后一部分啦~,persistence,讲了一些像什么 I/O devices,然后什么 file system,distributed system 这种东西。 Chapter 36: I/O Devices 这一部分首先讲的是 I/O devices,which is a very important part of computers。 三种 bus:memory bus,general I/O bus 和 peripheral I/O bus。 不过上面这个并不是真的现代计算机系统的架构,一个真的现在计算机的系统架构大概会像 Figure 36.2。 现在我们讲一讲 canonical device。意思就是所有 devices 的抽象,所有 devices 都要有以下的 feature。 所有的 device 都需要提够接口,也就是 interface,这样我们的系统,或者其他组件才能够“用”这个硬件。 其次所有的 device 都有其内部结构,这个就大家各不相同了,只要你提供了好的 abstraction,好的...
26Fall Graduate School 申请总结
今天已经是 12.5 号了,最近可以说是非常非常之忙碌,一堆 final project 没做,还有很多课马上考试还没复习,以及一堆的申请 DDL,以及 PhD 的面试。不过这两天感觉终于可以喘口气了,因为所有的期末考试前的 interview 都面完了,然后现在也不想学习,所以就来写一个 26 Fall graduate school 的小总结吧。 Background 因为现在还在申请,有点担心掉马甲,所以我就非常模糊的说一下我的 bg。 985 中外合办,国内 GPA: 3.94/4.0 (ranking: 10/110),国外 GPA: 3.96/4.0 (国外大学没有 ranking 这一套,不过 3.96 我个人感觉也算是比较高了)。 有一段 internship (个人感觉没用),以及一段科研(有一篇一作 paper 产出,但是 under review)。 所以其实我的 bg 绝对不算强,经常刷到什么本科好几篇顶会的同学,或者 3、5 段实习/科研经历,我只能甘拜下风。 Which schools did I choose? 因为我自觉我的 bg...
Statistics---Cramér-Rao Lower Bound (CRLB)
这个 blog 来讲一下克拉默-拉奥下限(Cramér-Rao Lower Bound, CRLB),主要是根据《Mathematical Statistics and Data Analysis, 3rd Ed.》中的内容做的整理。 1. 核心思想与目的 在统计学中,我们常常有多种方法来估计同一个未知参数 θ\thetaθ。CRLB 为我们提供了一个客观的基准来判断哪种估计方法更好。它的核心思想是,对于任何无偏估计量 (unbiased estimator),其方差不可能无限小,它必须大于或等于一个特定的理论最小值。这个最小值就是克拉默-拉奥下限。 主要作用: 提供一个 benchmark:我们可以将不同无偏估计量的方差与这个下限进行比较。 定义“最优”估计量:如果一个无偏估计量的方差能够达到这个下限,我们就称它为有效估计量 (efficient estimator),这意味着在所有无偏估计中,没有比它更精确的了。 2. 克拉默-拉奥不等式 (Cramér-Rao Inequality) 书中第 8.7 节的定理 A 给出了这个不等式的正式表述。 假设...
Statistics---Likelihood Ratio Test: From Simple Hypothesis to Composite Hypothesis
本篇内容主要就来讲一讲 likelihood ratio,感觉这部分在大部分的理工科统计中是没有被覆盖的,但却是一个有关 hypothesis test 的重要内容。 一、 简单假设下的似然比检验 (Simple Hypothesis) 似然比检验 (Likelihood Ratio Test, LRT) 提供了一种构造检验统计量(test statistic)的通用方法。首先考虑最简单的情况:检验两个完全指定了概率分布的假设。 1. 定义似然比 假设观测数据 X⃗=(X1,…,Xn)\vec{X} = (X_1, \dots, X_n)X=(X1,…,Xn) 具有联合概率密度函数或频率函数 f(x∣θ)f(x | \theta)f(x∣θ)。我们设定两个简单假设: 原假设 (H0H_0H0): X⃗∼f0(x⃗)\vec{X} \sim f_0(\vec{x})X∼f0(x) 备择假设 (HAH_AHA): X⃗∼fA(x⃗)\vec{X} \sim f_A(\vec{x})X∼fA(x) 在观测到数据 x⃗\vec{x}x 后,似然比统计量 LRLRLR...
常用命令总结
我的常用命令总结 Linux 查找带某个关键字的进程 方法一 ps aux | grep -i code 命令解释: ps aux: 列出系统上所有用户 (a) 正在运行的进程的详细信息 (u),包括那些没有终端的进程 (x)。 |: 这是管道符,将前一个命令的输出作为后一个命令的输入。 grep -i code: 从输入中查找所有包含 “code” 的行,-i 表示不区分大小写(这样能同时匹配到 code 和 Code)。 方法二 pgrep -afl code 命令解释: pgrep: “process grep”,专门用于查找进程。 -a: 显示完整的命令行。 -f: 在整个命令行中搜索模式(而不仅仅是进程名)。 -l: 显示进程名和PID。 kill 进程 pkill 命令可以直接根据进程的名称或其他属性来杀死进程,比手动查找 PID 更方便。 直接根据名称或关键词杀死进程: pkill -f "程序相关的关键词" -f: 这个选项非常有用,它会匹配完整的命令行,而不仅仅是进程名。 示例: 杀死所有包含...
Notes---Operating Systems: Three Easy Piece---Concurrency(UW-Madison CS 537)
这个 notes 主要用来记录有关 “Operating Systems: Three Easy Piece” 这本书第二大块的内容。就像书名写的,作者把 Operating system 的内容分为三大块,现在我们已经进行到了第二块:Concurrency。这一块的思想其实某种意义上是最重要的,因为 concurrency 的思想在非常多的地方都有用到,但是这一部分却是内容最少的,我还记得老师当时说的时候还挺惋惜的。 Chapter 26: Concurrency: An Introduction 关于 concurrency,第一个要介绍的概念就是 thread。之前我们说到的 program 其实都是 single-threaded program,但是现在我们就要转向 multi-threaded program。如果用一个非常浅显但是不准确的语言去描述 thread,其实就是同一个程序“同时”干好几个事情。从这个实现的功能上来讲,似乎跟多进程差不多,但有一些很底层上的区别,同时带来了很多根本上的不一样的 feature。 我们在切换 thread 的时候,也有...
Notes---Operating Systems: Three Easy Piece---Virtualization(UW-Madison CS 537)
UW-Madison 的 system 其实非常强,CS 537 是讲 operation system 的一节课,“Operating Systems: Three Easy Piece” 是这门课的教材,这篇 Blog 就主要记载我阅读这本 textbook 的 reading notes。 Chapter 2: Introduction to Operating Systems The main goal of an operating system is just to make the system easy to use. Abstraction 在计算机领域一直是一个非常重要的概念,正是一层一层的 abstraction,我们才能制造出当今如此强大的计算机。 在 OS 里,我们当然也用了这样的一个强大的概念,virtualization 就是一个非常重要的具体体现。我们会把物理层面上的各种 resources 进行 virtualization,来制造一个更通用的 interface 来给用户去使用,同时也方便 OS 在用户看不见的地方进行各种 “wild...
一个 CS 大三学生的碎碎念
在这里随便写点东西,做一个小小的总结吧。 感觉这三年学了很多东西,但还是很迷茫,不知道以后应该干什么。马上就大四了,感觉工作也找不到,博士也很难伸到,暑研也伸不到,唯一感觉做的比较好的就是绩点维持的挺好,而且大部分课都是有比较认真的学,确实是会了一些东西,但感觉都很理论,也不知道怎么用。找工作的时候需要的技术栈基本都不会,或者只会一点皮毛,真的遇到大型项目就啥也不会,也无从下手;找 research 也是,要读很多导师方向的论文,感觉之前学的一些东西也基本用不上,就感觉很多东西都匹配不上。但其实也没什么可抱怨的,毕竟感觉自己确实是有点三天打鱼两天晒网,很多东西想要自学但是从没有坚持做完过,虽然已经快大四了,感觉再开始自学一些东西已经有点晚了,但还是希望自己在最后一年真的完整的自学完几门网课,毕竟现在感觉已经明确了自己未来的方向了,就不能在松懈了。 最近也看到了很多大佬的总结,感觉大部分都是大一大二就已经很强,至少也是有明确道路了,空闲时间大部分都在提升自己的技术。我大一的时候在想,刚上大学,不用对自己太苛刻。应该只有在上大学之前的暑假系统的学了一下C语言,又因为要...
Statistics---Why We Use the t-Distribution to Estimate the Population Mean
In the world of statistics, one of our primary goals is to understand a large population by examining a small sample. A classic example is trying to figure out the average height of all adults in a country. We can’t measure everyone, so we take a sample and calculate the sample mean, Xˉ\bar{X}Xˉ. But how confident can we be that our sample mean is close to the true population mean, μ\muμ? This is where statistical inference comes in, and it leads us directly to the t-distribution. The Ideal...