08- 数据升维 (PolynomialFeatures) (机器学习)
创始人
2024-05-27 16:37:01
0
  • 在做数据升维的时候,最常见的手段就是将已知维度进行相乘(或者自乘)来构建新的维度
    • 使用 np.concatenate()进行简单的,幂次合并,注意数据合并的方向axis = 1

    • 数据可视化时,注意切片,因为数据升维后,多了平方这一维

# 4、多项式升维 + 普通线性回归
X = np.concatenate([X,X**2],axis = 1)
  • 使用 PolynomialFeatures 进行 特征升维
from sklearn.preprocessing import PolynomialFeatures
poly = PolynomialFeatures()   # 使用PolynomialFeatures进行特征升维
poly.fit(X,y)
X = poly.transform(X)
  • 调整字体大小: plt.rcParams[ 'font.size' ] = 18
import matplotlib.pyplot as plt
plt.rcParams['font.size'] = 18


1.1、多项式回归基本概念

对于多项式回归来说主要是为了扩展线性回归算法来适应更广泛的数据集,比如我们数据集有两个维度 x_1, x_2​,那么用多元线性回归公式就是: \hat{y} = w_0 + w_1x_1 + w_2x_2,当我们使用二阶多项式升维的时候,数据集就从原来的 x_1, x_2 扩展成了 x_1, x_2, x_1^2, x_2^2, x_1x_2 。因此多元线性回归就得去多计算三个维度所对应的w值:\hat{y} = w_0 + w_1x_1 + w_2x_2 + w_3x_1^2 + w_4x_2^2 + w_5x_1x_2

import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression# 1、创建数据,并进行可视化
X = np.linspace(-1,11,num = 100)
y = (X - 5)**2 + 3*X -12 + np.random.randn(100)
X = X.reshape(-1,1)
plt.scatter(X,y)# 2、创建预测数据
X_test = np.linspace(-2,12,num = 200).reshape(-1,1)# 3、不进行升维 + 普通线性回归
model_1 = LinearRegression()
model_1.fit(X,y)
y_test_1 = model_1.predict(X_test)
plt.plot(X_test,y_test_1,color = 'red')# 4、多项式升维 + 普通线性回归
X = np.concatenate([X,X**2],axis = 1)
model_2 = LinearRegression()
model_2.fit(X,y)
# 5、测试数据处理,并预测
X_test = np.concatenate([X_test,X_test**2],axis = 1)
y_test_2 = model_2.predict(X_test)# 6、数据可视化,切片操作
plt.plot(X_test[:,0],y_test_2,color = 'green')

1.2 使用PolynomialFeatures进行特征升维

import matplotlib.pyplot as plt
import numpy as np
from sklearn.preprocessing import PolynomialFeatures,StandardScaler
from sklearn.linear_model import SGDRegressor# 1、创建数据,并进行可视化
X = np.linspace(-1,11,num = 100)
y = (X - 5)**2 + 3*X -12 + np.random.randn(100)
X = X.reshape(-1,1)
plt.scatter(X,y)# 3、使用PolynomialFeatures进行特征升维
poly = PolynomialFeatures()   # 特征升维
poly.fit(X,y)
X = poly.transform(X)
s = StandardScaler()    # 归一化
X = s.fit_transform(X)# 4、训练模型
model = SGDRegressor(penalty='l2',eta0 = 0.01)
model.fit(X,y)# 2、创建预测数据
X_test = np.linspace(-2,12,num = 200).reshape(-1,1)
X_test = poly.transform(X_test)      # 特征升维
X_test_norm = s.transform(X_test)    # 归一化
y_test = model.predict(X_test_norm)
plt.plot(X_test[:,1],y_test,color = 'green')

1.3 多项式预测

天猫双十一销量与年份的关系是多项式关系!假定,销量和年份之间关系是三次幂关系:

{\color{Red} f(x) = w_1x + w_2x^2 + w_3x^3 + b}

import numpy as np
from sklearn.linear_model import SGDRegressor
import matplotlib.pyplot as plt
from sklearn.preprocessing import PolynomialFeatures
from sklearn.preprocessing import StandardScaler
plt.figure(figsize=(12,9))# 1、创建数据,年份数据2009 ~ 2019
X = np.arange(2009,2020)
y = np.array([0.5,9.36,52,191,350,571,912,1207,1682,2135,2684])# 2、年份数据,均值移除,防止某一个特征列数据天然的数值太大而影响结果
X = X - X.mean()
X = X.reshape(-1,1)# 3、构建多项式特征,3次幂
poly = PolynomialFeatures(degree=3)
X = poly.fit_transform(X)
s = StandardScaler()
X_norm = s.fit_transform(X)# 4、创建模型
model = SGDRegressor(penalty='l2',eta0 = 0.5,max_iter = 5000)
model.fit(X_norm,y)# 5、数据预测
X_test = np.linspace(-5,6,100).reshape(-1,1)
X_test = poly.transform(X_test)
X_test_norm = s.transform(X_test)
y_test = model.predict(X_test_norm)# 6、数据可视化
plt.plot(X_test[:,1],y_test,color = 'green')
plt.bar(X[:,1],y)
plt.bar(6,y_test[-1],color = 'red')
plt.ylim(0,4096)
plt.text(6,y_test[-1] + 100,round(y_test[-1],1),ha = 'center')
_ = plt.xticks(np.arange(-5,7),np.arange(2009,2021))

 

相关内容

热门资讯

初中毕业的作文600字【优质... 初中毕业的作文600字 篇一初中毕业的感悟初中三年的时光转瞬即逝,仿佛昨天还是一个胆小怯懦的小学生,...
初中话题作文:战争与和平40... 初中话题作文:战争与和平400字 篇一战争与和平战争是人类社会发展中最为残酷的一种方式,它带来的破坏...
我的似水年华初中作文800字... 我的似水年华初中作文800字 篇一初中时光如流水般匆匆而过,留下了我许多美好的回忆。回想起这段时光,...
师生情初一作文800字(通用... 师生情初一作文800字 篇一初中生活中,师生情是一种特殊而珍贵的情感。在我初一的这一年里,我深深地感...
初中成长作文【精选6篇】 初中成长作文 篇一: 从失败中成长初中生活对于我来说是一个充满挑战和机遇的阶段。在这个阶段,我经历了...
春节拜年的作文400字(精彩... 春节拜年的作文400字 篇一春节拜年,是中国传统文化中一项重要的习俗。每年农历正月初一,人们会亲朋好...
我的母亲(精彩4篇) 我的母亲 篇一我的母亲,是我生命中最重要的人。她是一位勤劳、善良而又坚强的女性。在我成长的过程中,她...
初中想象作文:外面的世界真精... 初中想象作文:外面的世界真精彩 篇一我站在窗前,看着外面的世界,不禁感叹:外面的世界真精彩!我想象着...
春天初一作文【经典6篇】 春天初一作文 篇一春天初一作文 春天初一作文 篇二春天的美丽景色春天初一作文 篇一春天初一作文春天终...
真情无价初中优秀作文(推荐3... 真情无价初中优秀作文 篇一真情无价真情无价,是人类最美好的情感之一。它是一种无私奉献、无条件付出的真...
我最敬佩的人——环卫工人(精... 我最敬佩的人——环卫工人 篇一环卫工人是我最敬佩的人,他们默默无闻地工作,为城市的清洁和卫生付出了巨...
这不是爱情是感恩初中作文(最... 这不是爱情是感恩初中作文 篇一我们常常在电影、小说中看到爱情的美好,而对于初中生来说,爱情似乎是离我...
我是超级木头人初中作文(精选... 我是超级木头人初中作文 篇一我是超级木头人我是一名超级木头人,这个称号是我最近才得到的。你可能会好奇...
初一我的新朋友作文600字【... 篇一:初一我的新朋友初一开学的第一天,我来到了新学校,满怀期待地等待着新的朋友。在新班级里,我遇到了...
情怀作文800字(通用6篇) 情怀作文800字 篇一怀念那段青葱岁月青春,是一种记忆,也是一种情怀。它仿佛是一朵鲜花,在岁月的长河...
风筝与风作文(优秀5篇) 风筝与风作文 篇一风筝是一种古老而美丽的飞行器,在人们的童年中扮演着重要的角色。与风紧密相连的风筝,...
我不再任性了初一作文600字... 我不再任性了初一作文600字5篇 篇一我不再任性了初一的时候,我是一个非常任性的孩子。只要我想要什么...
初中说明文作文(通用6篇) 初中说明文作文 篇一如何有效地学习数学数学作为一门重要的学科,对于初中生来说是一项必修课程。然而,很...
初中教育叙事【优选5篇】 初中教育叙事 篇一初中生活的喜怒哀乐初中生活是我人生中最难忘的时光。那是一个充满喜怒哀乐的阶段,每一...
写人的作文600字初【经典3... 写人的作文600字初 篇一:我的好朋友小明小明是我最好的朋友,他是一个聪明、乐观、有责任心的人。我们...