Posts

知识图谱(KnowledgeGraph)

因为要进行通过知识图谱的假新闻检测,所以搭建知识图谱是我们构建的第一步,目前我们选用的数据源是DBpedia,它的实体和关系都是从维基百科中抽取的,所以有较高的可信度。本来想将DBpedia数据导入到Neo4j中,但是数据繁多就放弃了,初步设想是使用SPARQL来检索信息。所以这一切的一切都要先对语义网络中的RDF、RDFS和OWL有一个初步了解,同时也需要对语义网络、语义网、链路数据以及知识图谱有一定的了解。

2018-03-14 / 4 min read

可靠数据传输协议

架构

应用层调用rdt_send()->传输层调用udt_send(),指在不可靠的协议上传输(IP协议)->接受方的传输层调用rdt_rcv()->受放的传输层调用deliver_data()将可靠数据发给接收方的应用层

如下图所示:

2018-01-12 / 8 min read

数据库性能优化

数据库两个基本概念

数据库 (Block)

数据块是数据库中数据在磁盘中存储的最小单位,也是一次IO访问的最小单位。一个数据块通常可以存储多条记录,数据块大小是DBA在创建数据库或表空间时指定。一个数据库可以包括多个数据文件,一个数据文件内又包含多个数据块。

RowId

ROWID是每条记录在数据库中的唯一标识。

优化方案

减少数据访问

索引 (Index)

索引表不是万能的,它的存在会大大增加表记录的DML(INSERT,UPDATE,DELETE)开销,正确的索引可以让性能提升100,1000倍以上,不合理的索引也可能会让性能下降100倍。

索引是啥

B-TREE索引也称为平衡树索引(Balance Tree),它是一种按字段排好序的树形目录结构,主要用于提升查询性能和唯一约束支持

2018-01-09 / 5 min read

DEEPLEARNING.AI NOTES FOR LESSON1_WEEK4 QUIZ

A 5-layer Neural Network

Because it is very similar with 2-layer neural network, I only post the source code rather than go through details with it, and some key points have been written into comments of code.

2017-11-12 / 7 min read

DEEPLEARNING.AI NOTES FOR LESSON1_WEEK3 QUIZ

Reminder: The general methodology to build a Nerual Network is to:

  1. Define the neural network structure (# of input units, # of hidden units, etc.).
  2. Initialize the model's parameters
  3. Loop:
    • Implement forward propagation
    • Compute loss
    • Implement backward propagation to get the gradients
    • Update parameters(gradient descent)

You often build helper functions to compute steps 1-3 and then merge them into one function wa call nn_model().

2017-10-21 / 7 min read

Logistic Regression

2017-09-05 / 4 min read