C4.5算法對數據的支持不是很穩定

劉學煒 發布于 2013/06/17 22:55
閱讀 389
收藏 1

從數據到大模型應用,11 月 25 日,杭州源創會,共享開發小技巧

程序代碼http://www.doharose.com/code/snippet_188162_22208

對如下兩組數據進行測試,生成的樹居然不是對稱的。兩組數據其實只是性別對換了。為啥生成的樹的結果不是男女結點對換呢?如果我對列屬性重新排序,生成的樹結果是不是又不一樣呢?難道我的算法有bug?沒有理解透C4.5?

第一組:
年齡,性別,職業,興趣,是否為朋友
青年,女,學生,足球,否
成年,男,律師,閱讀,是
成年,女,律師,足球,否
成年,女,學生,閱讀,是
青年,女,學生,籃球,否
青年,男,學生,籃球,是
青年,男,學生,閱讀,是
青年,男,學生,足球,是
青年,男,學生,游泳,是
老年,女,律師,籃球,否
老年,女,醫生,閱讀,否
老年,男,教師,游泳,否
老年,女,律師,閱讀,是
老年,女,教師,足球,否
老年,女,教師,閱讀,是
老年,男,教師,閱讀,是
成年,女,教師,籃球,是
老年,女,教師,足球,否
老年,女,農民,足球,否
成年,女,農民,閱讀,是

生成的決策樹:

第二組:
年齡,性別,職業,興趣,能否為朋友
青年,男,學生,足球,否
成年,女,律師,閱讀,是
成年,男,律師,足球,否
成年,男,學生,閱讀,是
青年,男,學生,籃球,否
青年,女,學生,籃球,是
青年,女,學生,閱讀,是
青年,女,學生,足球,是
青年,女,學生,游泳,是
老年,男,律師,籃球,否
老年,男,醫生,閱讀,否
老年,女,教師,游泳,否
老年,男,律師,閱讀,是
老年,男,教師,足球,否
老年,男,教師,閱讀,是
老年,女,教師,閱讀,是
成年,男,教師,籃球,是
老年,男,教師,足球,否
老年,男,農民,足球,否
成年,男,農民,閱讀,是

生成的決策樹:

加載中
0
劉學煒
劉學煒
對數據結構、次序更換都會導致結果不同
當前問題已關閉評論
OSCHINA
登錄后可查看更多優質內容
返回頂部
頂部
一本久久综合亚洲鲁鲁五月天,无翼乌口工全彩无遮挡H全彩,英语老师解开裙子坐我腿中间