2019年11月17日
0 写在前面
有段时间没有更新博客了,这篇其实是今年9月自己在一次组会上展示的内容,自我感觉做的还可以,因此与大家分享一下。本文中的一些见解可能不够严谨,对于理解不对的地方请不吝赐教。
1 当我们谈优化时,我们谈些什么
提到优化,我的脑海里最先想起的,便是Stanford CS231n的Slides中那张经典的...
阅读更多
2019年08月05日
写在前面
之前写了一篇 Scrapy 爬取网易新闻的博客,提到下次要尝试图片爬虫,于是,这篇博客诞生啦!(我怎么会鸽呢对不对)
事实上,对于网络爬虫,爬取图片和爬取文本大同小异,其思路大致都是:获取网页 -> 从网页中提取有用信息 -> 存储和进一步爬取。这次,我们要从网页中提取的信息从文本变成了图...
阅读更多
2019年07月12日
Summer School半程总结
今天是7月12日,研究生新生暑期学校第二周的星期五。再过一周,大学本科的最后一个暑假就要来了。
暑期学校选了两门课,“Information Retrieval & Information Extraction” 和 “R and Data Mining”,都是英文...
阅读更多
2019年07月10日
写在前面
最近在暑期学校选的一门课需要从网上爬取文本数据,借此机会复习一下 Python 网络爬虫~
使用的是自己之前用过的 Scrapy 框架,以下是这次自己的学习 & 动手过程。
1 复习时间
网络爬虫介绍
在介绍框架之前,简单介绍一下网络爬虫(Web Crawler)。
当我们上网时,浏...
阅读更多
2019年05月04日
What is zsh?
Shell 的类型有很多种,例如 Linux 和 MacOS 下默认的是 Bash。虽然 Bash 的功能已经足够完备,但对于以懒惰为美德的程序员来说,其提示功能不够强大,界面也不够酷(zhuang)炫(bi)。
而 zsh 作为 Shell 的一种,功能极其强大,但因为配置过于复杂,...
阅读更多
2019年04月18日
前言
寒假收藏的这篇《Research Primer for Graduate Students》(原文PDF链接),一直没抽时间读,最近读完了,随手自己翻译了一下,贴上来给各位看看。
Research Primer for Graduate Students
作为一名研究生,你可能会对开展自己的独立研究感到焦...
阅读更多
2019年04月16日
因为毕设涉及到截取视频帧这一操作,因此(在学长的推荐下)接触并使用了 ffmpeg 这个转码视频的强大工具。
1 What is ffmpeg?
ffmpeg 是一个非常有用的命令行程序,用于快速转码媒体文件。它是领先的多媒体框架 FFmpeg 的一部分,后者在其官网是这么介绍的:“(FFmpeg)能够解码、编...
阅读更多