Some Notes About SQLAlchemy

近期在收集处理大量的数据,通常是把 XML/文本格式的数据转为关系型,结构化的的数据,能够方便导出直接进行分析,尤其是导出能直接被 pandas 分析的格式(csv/json)。因此需要使用一个在 Python 下的 mysql 处理库,既然找了处理库,也干脆一步到位,直接选一个支持 ORM 的库。于是,就选择了 SQLAlchemy。用了一段时间后,写个记录来记下这段时间用到的常用的东西。

SQLAlchemy 是 Python 编程语言下的一款开源软件。提供了 SQL 工具包及对象关系映射(ORM)工具,主要能满足一下的需求:

  • 提供对数据库的常用操作:增删改查
  • 提供 ORM 功能,可以让操作的单元变为对象,而不用写 sql 语句进行硬编码/解码解析数据
……

Summary of Automate the Boring Stuff with Python

本书是为如何用Python进行自动化处理工作以及可以用在哪些方面,面向的人群为想要提高生产力,减少重复劳动的非程序员。 作为一个未来的程序员,我为什么推荐这本面向非程序员的书呢?在我看来,code是一个工具,既然是一种工具,就应该用于帮助解决问题和满足需求。但实际上,在我们许多的coding相关的学习……

summary of <斯坦福高效睡眠法>

睡眠的质比量重要 睡眠的长短 睡眠的时间长短由基因决定,过长过短均不好 睡眠时间过长也没什么用 睡眠时间过短会导致睡眠债务,会引发 肥胖/糖尿病/高血压等等疾病 突发出现瞬间睡眠:突然走神进入睡眠状态若干秒,非常危险 影响寿命 睡眠债务可以通过延长睡眠时间偿还,在坚持一段时间进行延长睡眠(睡过量的时间)后,睡眠的时……

如何克服过于在意别人想法的心理

这几天在分析自己做事情一直很怕被人看见的问题,得出的深层原因为自己很在意别人的想法。事实上,很在意别人想法和评价的这个现象,真的对我有着很多 negative 的影响,例如心里焦虑,对事情无信心等影响,遂将其当作近来需要克服的目标之一。在知乎看到一个很棒的相关回答,进行记录学习之。 表现 过于在意他人看法的人,往往: 会以……

组会谈话启示录(一)

又是组会结束之后的轻松时刻,本次组会由于人数较少,所以谈话内容也比较有针对性,收获颇大,但又由于只是干听,担心会很快忘却,遂打算重新回忆,记录下来,想到啥就写啥,通过输出进行再学习,同时,相信也能给刚踏上科研路的各位带来一点受益。 About Empirical Study 所谓的 empirical study,其实就是对收集到的数据进行分析并 report……

Summary of Ultralearning

本文是来自我非常欣赏的博主 Scott Young 的新书《Ultralearning》的读后总结,本书主要介绍了 ultralearning 的相关概念及方法原则。 定义 什么是 ultraleaning?从单词上面来讲,就是 ultra + learning,可以理解为超一般的学习。书中给出的定义为: A strategy for acquiring skills and knowneledge that is both self-directed and intense strategy: 它是一种学习的策略(just a strategy 而非……

保研之路

在国庆前夕,保研的事情尘埃落定,最终被南大计科录取,将进入软件质量研究所,内心的失学焦虑才得以缓解大部分。在国家推免系统接受拟录取的时候,我与绝大多数保研党一样,内心异常兴奋,而到了第二天之后,这种兴奋已经变成了平静以及后续事情的焦虑。为了以后不至于忘却这一件重大的事,遂打算写下一篇流水账来回顾一下这段保研的历程,抒发一下相关的情感,另外也可作为后来人的一点经验和参考。大家可以当作故事来看看(主要是给自己看看),不想看的可以跳到最后看看经验。

……

记2019南京大学计算机系开放日

因为没有找到曾经参加南大计算机系夏令营的学长学姐(好像也没有去找过),参加夏令营前的准备基本都是靠着网上搜到的各种资料,通过看他人的经历与记录,了解夏令营相关考核的内容和侧重点,从而作出针对性的准备。说实话,从前人的博客记录中,我感到获益良多,在参加夏令营时,就想着也要记录一下,留作后人参考,这也可……

枚举排列

如何按字典序从小到大输出前 n 个数的所有排列? 递归调用 将数字分成两部分: 已确定前缀序列 待定元素 每次移除一个待定元素添加到前缀序列末尾,进行下一次递归 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 void print_permutation(int n, int* A, int cur) { if(cur == n) { //递归边界 for(int i = 0; i < n; i++) printf("%d ", A[i]); printf("\n"); } else for(int i = 1; i <= n; i++) { //尝试在 A[cur] 中填各种整数 i int ok = 1; for(int j = 0;……

并查集

在计算机科学中,并查集是一种树型的数据结构,用于处理一些不交集(Disjoint Sets)的合并及查询问题。 有一个联合-查找算法(union-find algorithm)定义了两个用于此数据结构的操作: Find:确定元素属于哪一个子集。它可以被用来确定两个元素是否属于同一子集。 Union:将两个子集……

Windows 快捷键

无意中在油管看到的快捷键集锦视频,有些还是挺有用的,遂记录之。 原视频可点此 打开新的虚拟桌面 Win + Ctrl+ d 虚拟桌面切换 Win + Ctrl + 方向键左/右 最小化所有应用并返回桌面 Win + m 临时切回桌面 Win + , 最大化/最小化当前程序Win + 方向键上/下 打开/收回任务栏中程序 Win + 数字键 当前程序快速分屏 Win + 方向键 查看所有程序 Win + Tab 或 Win……

如何减少焦虑

在最近的公众号推送中看到的一篇 Scott H. Young 的关于减少焦虑的博文推送,感觉方法还不错,刚好这段时间常常因为保研的事情而感到焦虑,遂打算写一篇文章学习一下其中的方法。不过微信推送当中的中文翻译实在有一点让人摸不着头脑,遂上官网找了 原文 重新阅读并进行记录。 每个人都会产生焦虑,如担心犯错,担心收到批评,担心事业失……

C++ std::set

集合作为一个比较重要的数据结构,具有不含重复元素的性质,在许多算法中实现去重操作时,都需要用到集合这个数据结构。在近来使用 c++ 刷题,用集合踩过较多的坑以后,决定写篇东西记录一下标准库中的集合。 集合一般通过二分搜索树实现。集合内元素保持严格弱序性质 性质 Associative:元素不是靠决定位置访问的 Or……

判断二分图

Problem 给定一个无向图,判断这个图是否二分图。 如果我们能将一个图的节点集合分割成两个独立的子集A和B,并使图中的每一条边的两个节点一个来自A集合,一个来自B集合,我们就将这个图称为二分图。 graph将会以邻接表方式给出,graph[i]表示图中与节点i相连的所有节点。每个节点都是一个在0到graph.le……

异常检测

一般的异常检测问题为:对于给定的一系列样本,给出一个新的测试样本,判断该测试样本是否属于这系列已知样本/该样本是否异常样本。

例如:对于一批正常的引擎,监测带有一系列的数据(散热,震动强度),对于一个新的引擎,测得相关的数据,判断其是否异常引擎。

……