吴恩达团队NLP C2_W4_Assignment任务:计算单词嵌入并用于情感分析Part1:The Continuous bag of words model(CBOW)在这个模型下,我们给出上下文的单词,并尝试判断中间词。
如有个字符串为:I am happy because I am learning
我们设C = 2 ,当我们要预测happy时,则:
𝐶 words before: [I, am]
𝐶 words after: [because, I]
模型结构图如下:
其中$\bar x$为:
公式如下:
\begin{align} h &= W_1 \ X + ...
吴恩达团队NLP C2_W3_Assignment任务:自动完成系统Part1:处理数据1.1 将文本数据切割成一行一个字符串12345678910111213141516171819def split_to_sentences(data): """ Split data by linebreak "\n" Args: data: str Returns: A list of sentences """ sentences = data.split('\n') # Additional cle...
吴恩达团队NLP C2_W2_Assignment任务:词性标注(POS)Part1:Training1.1 构建 transition_counts, emission_counts, tag_counts
transition_counts 计算的是每个tag与另一个tag相邻的次数 → (prev_tag, tag), 便于之后计算$P(ti |t{i-1})$
emission_counts 计算的是word与相应tag出现的次数 → (tag, word),便于之后计算$P(w_i|t_i)$
tag_counts 计算的是每个tag出现的次数
123456789101112...
吴恩达团队NLP C2_W1_Assignment任务:自动校正单词拼写Part1:处理数据将字符串数据读入,并将字符串都转化为小写,最后通过正则表达式将其中的单词找出来。
1234567891011121314151617def process_data(file_name): """ Input: A file_name which is found in your current directory. You just have to read it in. Output: words: a list containing all...
吴恩达团队NLP C1_W4_Assignment课程链接:Coursera | Online Courses & Credentials From Top Educators. Join for Free | Coursera
任务:朴素机器翻译及LSH(局部敏感度哈希)Part1: 实现英语转法语1.1 生成embedding和转换矩阵1234567891011121314151617181920212223242526272829303132333435def get_matrices(en_fr, french_vecs, english_vecs): """ ...
吴恩达团队NLP C1_W3_Assignment课程链接:Coursera | Online Courses & Credentials From Top Educators. Join for Free | Coursera
任务:学习词向量,预测单词的类比,通过PCA降维,通过余弦相似性来比较单词。Part1: 余弦相似性余弦相似性可由下述公式表示:
\cos (\theta)=\frac{\mathbf{A} \cdot \mathbf{B}}{\|\mathbf{A}\|\|\mathbf{B}\|}=\frac{\sum_{i=1}^{n} A_{i} B_{i}}{...
吴恩达团队NLP C1_W2_AssignmentCoursera | Online Courses & Credentials From Top Educators. Join for Free | Coursera
任务:通过朴素贝叶斯的方法来对tweet进行情感分析
Part 1: 处理数据首先对数据进行预处理,删除杂音数据,并对tweet进行分词。
123456custom_tweet = "RT @Twitter @chapagain Hello There! Have a great day. :) #good #morning http://chapagain.co...
吴恩达团队NLP C1_W1_Assignment课程链接:Coursera | Online Courses & Credentials From Top Educators. Join for Free | Coursera
任务:学习逻辑回归,对于任意一条tweet(推文),可以进行情感分析(正面或负面)。
步骤:
将数据集分为训练集与测试集,比例为8 : 2
将正面与负面情绪的数据数量汇总成两个矩阵,分别为训练矩阵与测试矩阵。其中正面情绪的标为1,负面的标为0。
12train_y = np.append(np.ones((len(train_pos), 1)), np...
题目简介:一个整数总可以拆分为2的幂的和,例如: 7=1+2+4 7=1+2+2+2 7=1+1+1+4 7=1+1+1+2+2 7=1+1+1+1+1+2 7=1+1+1+1+1+1+1 总共有六种不同的拆分方式。 再比如:4可以拆分成:4 = 4,4 = 1 + 1 + 1 + 1,4 = 2 + 2,4=1+1+2。 用f(n)表示n的不同拆分的种数,例如f(7)=6. 要求编写程序,读入n(不超过1000000),输出f(n)%1000000000。
输入描述:1每组输入包括一个整数:N(1<=N<=1000000)。
输出描述:1对于每组数据,输出f(n)%1000...
题目简介:N位同学站成一排,音乐老师要请其中的(N-K)位同学出列,使得剩下的K位同学不交换位置就能排成合唱队形。 合唱队形是指这样的一种队形:设K位同学从左到右依次编号为1, 2, …, K,他们的身高分别为T1, T2, …, TK, 则他们的身高满足T1 < T2 < … < Ti , Ti > Ti+1 > … > TK (1 <= i <= K)。 你的任务是,已知所有N位同学的身高,计算最少需要几位同学出列,可以使得剩下的同学排成合唱队形。
输入描述:12输入的第一行是一个整数N(2 <= N <= 100),表示同...