精确率、召回率、F1 值、ROC/AUC 、PRC各自的优缺点是什么?

精确率、召回率、F1 值、ROC、AUC、PRC都是机器学习模型的常用评价标准,那么它们的区别和联系以及各自应用场景是什么呢?

这些指标的含义

1
2
3
4
Precision:P=TP/(TP+FP)
Recall:R=TP/(TP+FN)
F1-score:2/(1/P+1/R)
ROC/AUC:TPR=TP/(TP+FN), FPR=FP/(FP+TN)

TP —— True Positive (真正, TP)被模型预测为正的正样本;可以称作判断为真的正确率

TN —— True Negative(真负 , TN)被模型预测为负的负样本 ;可以称作判断为假的正确率

FP ——False Positive (假正, FP)被模型预测为正的负样本;可以称作误报率

FN—— False Negative(假负 , FN)被模型预测为负的正样本;可以称作漏报率

Read More

PDF click return

在阅读PDF文档时,如果点击了文档中的链接,跳转到另一页,想再快速返回原来的页面,使用alt+左箭头的组合键即可。

根据情况的不同,有时需要使用若干次才能返回原来的页面,这个组合键就相当于回退,如果点击了链接到了新的页面,在新的页面上又移动了页面,如向上或向下浏览,那么至少要使用2次或2次以上alt+左箭头组合键才能终点原链接处。

而想要再次回退就使用alt+右箭头组合进行操作即可。

RECURRENT NEURAL NETWORKS TUTORIAL, PART 3 – BACKPROPAGATION THROUGH TIME AND VANISHING GRADIENTS

在之前的部分我们实现了RNN,但是并未深入探究时间反向传播算法,本文将对这一点作详细说明。我们将了解关于梯度消失问题的知识,它促使了LSTM和GRU的出现,而这两者都是NLP领域非常常见的模型。

##BACKPROPAGATION THROUGH TIME (BPTT)

首先我们回顾一下RNN的基本等式:

Read More

Vim 练级攻略二

第三级 – 更好,更强,更快

先恭喜你!你干的很不错。我们可以开始一些更为有趣的事了。在第三级,我们只谈那些和vi可以兼容的命令。

更好

下面,让我们看一下vim是怎么重复自己的:

  1. . → (小数点) 可以重复上一次的命令
  2. N → 重复某个命令N次

Read More

Vim 练级攻略一

你想以最快的速度学习人类史上最好的文本编辑器VIM吗?你先得懂得如何在VIM幸存下来,然后一点一点地学习各种戏法。

Vim: the Six Billion Dollar editor

Better, Stronger, Faster.

学习Vim并且其会成为你最后一个使用的文本编辑器。没有比这个更好的文本编辑器了,非常地难学,但是却不可思议地好用。

Read More

RECURRENT NEURAL NETWORKS TUTORIAL, PART 2 – IMPLEMENTING A RNN WITH PYTHON, NUMPY AND THEANO

本文将用Python实现完整的RNN,并且用Theano来优化。

语言模型

我们的目标是使用RNN建立一个语言模型。以下我们举例说明什么是语言模型。例如,你说了一句包括$$m$$个词语的句子,语言模型可以为这句话出现的概率打分:

$$P(w_1,\cdots,w_m) = \prod_{i=1}^m P(w_i \mid w_1,\cdots,w_{i-1})$$

Read More

ubuntu下修改DNS并且避免重启失效的方法

安装好Ubuntu之后设置了静态IP地址,再重启后就无法解析域名。想重新设置一下DNS,打开/etc/resolv.conf

1
2
3
cat /etc/resolv.conf
# Dynamic resolv.conf(5) file for glibc resolver(3) generated by resolvconf(8)
# DO NOT EDIT THIS FILE BY HAND -- YOUR CHANGES WILL BE OVERWRITTEN

也就是说,这个文件是resolvconf程序动态创建的,不要直接手动编辑,修改将被覆盖。

试了试,重启果然失效了,若不解决每次重启都得修改DNS,那多麻烦啊!

还好找到如下办法:

  1. 修改/etc/resolvconf/resolv.conf.d/base(这个文件默认是空的),在其内插入:
    1
    2
    nameserver 8.8.8.8
    nameserver 8.8.4.4
  2. 保存后执行:[sudo] resolvconf -u,即可。

RECURRENT NEURAL NETWORKS TUTORIAL, PART 1 – INTRODUCTION TO RNNS

RNN,也即是递归神经网络,是许多NLP任务的流行处理模型。本部分中将简介RNN。

本部分主要实现此模型– recurrent neural network based language model,模型有两个作用:

  1. 可以基于出现的概率对句子进行打分,可以对于语法和语义正确性进行评估,从而应用于机器翻译等领域。
  2. 可以依据概率生成新的语料。

Read More