校园春色亚洲色图_亚洲视频分类_中文字幕精品一区二区精品_麻豆一区区三区四区产品精品蜜桃

主頁 > 知識庫 > Python方差特征過濾的實例分析

Python方差特征過濾的實例分析

熱門標簽:西藏房產智能外呼系統要多少錢 ai電話機器人哪里好 ai電銷機器人源碼 百度地圖標注沒有了 地圖標注審核表 湛江智能外呼系統廠家 宿遷星美防封電銷卡 外呼并發線路 長沙高頻外呼系統原理是什么

說明

1、通過特征本身的方差來篩選特征。特征的方差越小,特征的變化越不明顯。

2、變化越不明顯的特征對我們區分標簽沒有太大作用,因此應該消除這些特征。

實例

def variance_demo():
    """
    過濾低方差特征
    :return:
    """
    # 1. 獲取數據
    data = pd.read_csv('factor_returns.csv')
    data = data.iloc[:, 1:-2]
    print('data:\n', data)
 
    # 2. 實例化一個轉換器類
    transfer = VarianceThreshold(threshold=10)
 
    # 3. 調用fit_transform()
    data_new = transfer.fit_transform(data)
    print('data_new:\n', data_new, data_new.shape)
 
   
    return None

知識點擴充:

方差過濾法

VarianceThreshold 是特征選擇的一個簡單基本方法,其原理在于–底方差的特征的預測效果往往不好。而VarianceThreshold會移除所有那些方差不滿足一些閾值的特征。默認情況下,它將會移除所有的零方差特征,即那些在所有的樣本上的取值均不變的特征。

sklearn中的VarianceThreshold類中重要參數 threshold(方差的閾值),表示刪除所有方差小于threshold的特征 #不填默認為0——刪除所有記錄相同的特征。

import pandas as pd
import numpy as np
np.random.seed(1) #設置隨機種子,實現每次生成的隨機數矩陣都一樣
a= np.random.randint(0, 200,10)
b= np.random.randint(0, 200,10)
c= np.random.randint(0, 200,10)
d= [9,9,9,9,9,9,9,9,9,9]
data=pd.DataFrame({"A" : a,"B" : b,"C" : c,"D" : d})
data
from sklearn.feature_selection import VarianceThreshold
sel_model = VarianceThreshold(threshold = 0)
#刪除不合格特征之后的新矩陣
sel_model.fit_transform(data)

到此這篇關于Python方差特征過濾的實例分析的文章就介紹到這了,更多相關Python方差特征過濾的實現內容請搜索腳本之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持腳本之家!

標簽:盤錦 海南 南平 漯河 大同 林芝 寧夏 普洱

巨人網絡通訊聲明:本文標題《Python方差特征過濾的實例分析》,本文關鍵詞  Python,方差,特征,過濾,的,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《Python方差特征過濾的實例分析》相關的同類信息!
  • 本頁收集關于Python方差特征過濾的實例分析的相關信息資訊供網民參考!
  • 推薦文章
    主站蜘蛛池模板: 张家口市| 荣成市| 高州市| 搜索| 淮南市| 珲春市| 宝山区| 周口市| 梨树县| 寿阳县| 东源县| 遂川县| 隆化县| 岑巩县| 安阳县| 双流县| 龙井市| 察雅县| 堆龙德庆县| 台东县| 东兰县| 融水| 贵阳市| 东乡县| 泰和县| 浑源县| 集贤县| 江门市| 湘乡市| 谷城县| 祁阳县| 阳春市| 瓦房店市| 海伦市| 崇州市| 通山县| 永福县| 富平县| 顺义区| 临西县| 昌都县|