python聚类算法之dbsacn实例分析

本文实例讲述了python聚类算法之dbsacn。分享给大家供大家参考，具体如下：

dbscan：是一种简单的，基于密度的聚类算法。本次实现中，dbscan使用了基于中心的方法。在基于中心的方法中，每个数据点的密度通过对以该点为中心以边长为2*eps的网格(邻域)内的其他数据点的个数来度量。根据数据点的密度分为三类点:

核心点：该点在邻域内的密度超过给定的阀值minps。
边界点：该点不是核心点，但是其邻域内包含至少一个核心点。
噪音点：不是核心点，也不是边界点。

有了以上对数据点的划分，聚合可以这样进行：各个核心点与其邻域内的所有核心点放在同一个簇中，把边界点跟其邻域内的某个核心点放在同一个簇中。

# scoding=utf-8
import pylab as pl
from collections import defaultdict,counter
points = [[int(eachpoint.split(“#”)[0]), int(eachpoint.split(“#”)[1])] for eachpoint in open(“points”,”r”)]
# 计算每个数据点相邻的数据点，邻域定义为以该点为中心以边长为2*eps的网格
eps = 10
surroundpoints = defaultdict(list)
for idx1,point1 in enumerate(points):
for idx2,point2 in enumerate(points):
if (idx1 < idx2): if(abs(point1[0]-point2[0])

发表评论 取消回复

发表评论取消回复