Jacky's blogs
首页
归档
标签
分类
链接
About
SklearnAPI
列表
Music
Movie
搜索
文章
68
标签
25
分类
55
首页
归档
标签
分类
链接
About
SklearnAPI
列表
Music
Movie
Jacky's blogs
读书笔记《scikit-learn-机器学习常用算法原理及编程实战》第10章PCA
2019-12-27
|
sklearn
metrics
confusion_matrix及np.set_printoptions
decomposition
PCA
numpy
concatenate
classification_report
logging
seaborn sns.heatmap
本篇内容主要来源于白板书推导 背景介绍 过拟合 增加Data 正则化 降维 直接降维:特征选择 线性降维:PCA、MDS 非线性降维:流形LSOMAP、LLE 维度灾难 集合角度 数据稀疏,且分布不均 预备知识 基础知识 数据: x=(x1⋯xn)nxpT=(x1 ...
读书笔记《scikit-learn-机器学习常用算法原理及编程实战》第8章SVM
2019-12-26
原理总结: 对偶的目的:使用核技巧 L=∑i=1mαi−12∑i=1m∑j=1mαiαjy(i)y(j)x(i)Tx(j)L = \sum_{i=1}^m\alpha_i-\frac{1}{2}\sum_{i=1}^m\sum_{j=1}^m\alpha_i\alpha_jy^{(i)}y^{ ...
数据划分
2019-12-25
|
sklearn
model_selection
KFolds/GroupKFold/ShuffleSplit/StratifiedKFold/StratifiedShuffleSplit/GroupShuffleSplit
本文的jupyter-notebook地址:https://nbviewer.jupyter.org/github/wangjs-jacky/Jupyter-notebook/blob/master/00_API_document/交叉验证.ipynb 说明:本文的标题取得是数据划分,而jupy ...
读书笔记《scikit-learn-机器学习常用算法原理及编程实战》第5章线性回归算法
2019-12-25
Example01:利用PolynomialFeatures解决过拟合问题 线性回归模型实在是太简单了,非常容易导致欠拟合,根据前文中解决欠拟合的手段一共有两个: 增加物理特征,如房屋的地段,房屋的朝向等 增加无意义的数学变量。使用sklearn.preprocessing.Polynomi ...
读书笔记《scikit-learn-机器学习常用算法原理及编程实战》第6章逻辑回归
2019-12-25
逻辑回归的核心公式 成本函数: J(θ)=−1m[∑i=1myilog(hθ(xi)+(1−yi)log(1−hθ(xi))]J(\theta)=-\frac{1}{m}[\sum_{i=1}^my_ilog(h_\theta(x_i)+(1-y_i)log(1-h_{\theta}(x_i))] ...
读书笔记《scikit-learn-机器学习常用算法原理及编程实战》第7章决策树
2019-12-25
原理说明: DecisionTreeClassifier from sklearn.tree import DecisionTreeClassifierdecision_tree = DecisionTreeClassifier(criterion='gini', splitter='best', ...
python中对各类数据存储方式的操作
2019-12-24
|
python
list/str/dict/set转换
0 前言基础 1 科普 关键字/函数/方法 关键字:del list[0] 函数:print("str") - print是一个函数 方法:list.append()方法是基于对象的基础上说的。 1 列表【List】 1.1 对 列表 的方法 查阅方法:在Ipyth ...
读书笔记《scikit-learn-机器学习常用算法原理及编程实战》第4章k-近邻算法
2019-12-24
K-近邻 算法说明 K近邻的基本算法很好理解:新的样本,由离它近的几个邻居投票决定的。 所以算法就很好写出来了: 计算新的样本与所有样本的距离,存在一个变量,假设是A。 对A进行排序,选出最近k个距离对应的label标签值。 根据lable标签,决定新样本的label 算法优缺点: 优点 ...
读书笔记《scikit-learn-机器学习常用算法原理及编程实战》第3章机器学习理论基础
2019-12-20
过拟合和欠拟合 PolynomialFeatures验证欠拟合和过拟合案例 成本函数 最小二乘误差作为成本函数,但是sklearn用score来作为判断依据。 学习曲线学习 gridSearchCV网格搜索 Pipeline实践与学习曲线learning_curve ...
git教程
2019-12-20
Git的背景 Git是什么? 目前世界上最先进的分布式版本控制系统 版本控制 现实情况 希望做到的样子 集中式vs分布式 集中式:版本库是集中存放在中央服务器的,而干活的时候,用的都是自己的电脑,所以要先从中央服务器取得最新的版本,然后开始干活,干完活了, ...
1
…
3
4
5
6
Jacky
文章
68
标签
25
分类
55
加入书签
公告
有志者,事竟成,破釜沉舟,二百秦关终属楚; 苦心人,天不负,卧薪尝胆,三千越甲可吞吴.
最新文章
噪声测试实验
2020-04-11
谱减法
2020-04-11
噪声对语音统计特性的影响
2020-04-09
数字信号处理--FIR的线性相位特性
2020-04-07
数字信号处理--Z变换之极零分析
2020-04-07
分类
Matlab
1
绘图
1
Matlab编程
5
EM
1
LDA
1
分类Demo
1
向量化技术
1
logging
1
numpy
1
concatenate
1
pandas
1
to_dict
1
python
2
list/str/dict/set转换
1
matplotlib
1
python小项目
1
seaborn sns.heatmap
1
sklearn
12
datasets
2
make_circles/make_moons/make_blobs/make_blobs
1
make_classification
1
decomposition
1
PCA
1
feature_extraction
1
DictVectorizer
1
feature_selection
1
SelectKBest
1
f_regression
1
linear_model
1
LogisticRegression
1
LogisticRegressionCV
1
metrics
1
classification_report
1
confusion_matrix及np.set_printoptions
1
model_selection
3
GridSearchCV
1
KFolds/GroupKFold/ShuffleSplit/StratifiedKFold/StratifiedShuffleSplit/GroupShuffleSplit
1
ShuffleSplit
1
learning_curve
1
pipeline
1
Pipeline
1
preprocessing
4
PolynomialFeatures
3
StandardScaler/MinMaxScaler/OneHotEncoder/Normalizer/normalize/
1
tree
1
DecisionTreeClassifier
1
实验
1
过拟合和欠拟合实验
1
声纹识别
3
正则表达式
1
西瓜书
5
第七章贝叶斯分类器
1
第三章线性模型
2
第六章SVM
1
第四章决策树
1
标签
Matlab绘图
Matlab编程
PPCA
PolynomialFeatures
Python环境/包管理
git
hide
pandas
sklearn
windows美化
声纹识别
教程
数字信号处理
文献复现
杂类
正则表达式
爬虫
牛顿法
聚类
西瓜书
论文复现
读书笔记
资源
转载
软件使用教程
归档
2020年04月
8
2020年03月
9
2020年02月
8
2020年01月
7
2019年12月
23
2019年11月
10
2019年10月
3
网站资讯
文章数目 :
68
已运行时间 :
本站访客数 :
本站总访问量 :
繁
本地搜索
由
hexo-generator-search
提供支持