從數據到大模型應用,11 月 25 日,杭州源創會,共享開發小技巧
程序代碼http://www.doharose.com/code/snippet_188162_22208
對如下兩組數據進行測試,生成的樹居然不是對稱的。兩組數據其實只是性別對換了。為啥生成的樹的結果不是男女結點對換呢?如果我對列屬性重新排序,生成的樹結果是不是又不一樣呢?難道我的算法有bug?沒有理解透C4.5?
第一組:
年齡,性別,職業,興趣,是否為朋友
青年,女,學生,足球,否
成年,男,律師,閱讀,是
成年,女,律師,足球,否
成年,女,學生,閱讀,是
青年,女,學生,籃球,否
青年,男,學生,籃球,是
青年,男,學生,閱讀,是
青年,男,學生,足球,是
青年,男,學生,游泳,是
老年,女,律師,籃球,否
老年,女,醫生,閱讀,否
老年,男,教師,游泳,否
老年,女,律師,閱讀,是
老年,女,教師,足球,否
老年,女,教師,閱讀,是
老年,男,教師,閱讀,是
成年,女,教師,籃球,是
老年,女,教師,足球,否
老年,女,農民,足球,否
成年,女,農民,閱讀,是
生成的決策樹:
第二組:
年齡,性別,職業,興趣,能否為朋友
青年,男,學生,足球,否
成年,女,律師,閱讀,是
成年,男,律師,足球,否
成年,男,學生,閱讀,是
青年,男,學生,籃球,否
青年,女,學生,籃球,是
青年,女,學生,閱讀,是
青年,女,學生,足球,是
青年,女,學生,游泳,是
老年,男,律師,籃球,否
老年,男,醫生,閱讀,否
老年,女,教師,游泳,否
老年,男,律師,閱讀,是
老年,男,教師,足球,否
老年,男,教師,閱讀,是
老年,女,教師,閱讀,是
成年,男,教師,籃球,是
老年,男,教師,足球,否
老年,男,農民,足球,否
成年,男,農民,閱讀,是
生成的決策樹: