PengboLiu's BLOG

刘朋伯的博客


  • 首页

  • 关于

  • 标签

  • 分类

  • 归档

  • 搜索

NLTK中的Stemmers

发表于 2019-02-23 | 分类于 Python |

Stemmers

在英语中,一个单词常常是另一个单词的“变种”,如:happy=>happiness,这里happy叫做happiness的词干(stem)。在信息检索系统中,我们常常做的一件事,就是在Term规范化过程中,提取词干(stemming),即除去英文单词分词变换形式的结尾。

阅读全文 »

[数据结构与算法] 二叉树的应用

发表于 2018-12-10 | 分类于 数据结构与算法 , 二叉树 |

递归

“递归”是解决二叉树相关问题时常用的方法,在调用一个函数的过程中又出现直接或间接地调用该函数本身,称为函数的递归(recursive)调用。下面的代码就是利用递归求解斐波那契(Fibonacci)数列中的第n个数字:

阅读全文 »

[数据结构与算法] 二叉树简介

发表于 2018-12-03 | 分类于 数据结构与算法 , 二叉树 |

介绍

树 是一种经常用到的数据结构,用来模拟具有树状结构性质的数据集合。

树里的每一个节点有一个根植和一个包含所有子节点的列表。从图的观点来看,树也可视为一个拥有 N 个节点和 N-1 条边的一个有向无环图。

二叉树 是一种更为典型的树树状结构。如它名字所描述的那样,二叉树是每个节点最多有 两个子树 的树结构,通常子树被称作 “左子树” 和 “右子树”。

本文主要介绍二叉树的表示方法、二叉树的三种遍历方式以及如何构造一棵二叉树。

阅读全文 »

[论文笔记] 学习率周期调整方法——Cyclical Learning Rates

发表于 2018-11-27 | 分类于 Paper Notes , Learning Rate |

论文概述

本文是论文《Cyclical Learning Rates for Training Neural Networks》的学习笔记。论文提出了学习率(learning rate)周期调整的方法:“Cyclical Learning Rates”,简称“CLS”,该方法在kaggle竞赛中被广泛应用。论文链接:https://arxiv.org/abs/1506.01186 。

阅读全文 »

[论文笔记] 抽取式自动文本摘要模型——SummaRuNNer

发表于 2018-11-13 | 分类于 Paper Notes , Summarization |

论文概述

本文发表在AAAI 2017上,作者是Ramesh Nallapati, Feifei Zhai和Bowen Zhou,论文链接:https://arxiv.org/abs/1611.04230 。

这篇文章提出了一个基于RNN的模型,来完成抽取式自动文本摘要任务。模型公式具有可解释性,并且可以利用已有的abstractive summary数据训练我们的extractive model。

阅读全文 »

[LeetCode 136] Single Number

发表于 2018-11-05 | 分类于 数据结构与算法 , 数组 |

给定一个非空整数数组,除了某个元素只出现一次以外,其余每个元素均出现两次。找出那个只出现了一次的元素。

阅读全文 »

[LeetCode 26 & 80] Remove Duplicates from Sorted Array

发表于 2018-09-28 | 分类于 数据结构与算法 , 数组 |

LeetCode 26题与80题,两者很相似,都是在有序数组中去除重复项。题目如下:

阅读全文 »

100 numpy exercises

发表于 2018-09-28 | 分类于 Python |

100道关于numpy的练习

阅读全文 »
Patrick Liu

Patrick Liu

刘朋伯写字的地方

8 日志
7 分类
13 标签
GitHub
© 2019 Patrick Liu
由 Hexo 强力驱动
|
主题 — NexT.Pisces v5.1.4