R语言

  • R语言数据类型转换

    test for data typeis.numeric(), is.character(), is.vector(), is.matrix(), is.data.frame()convert itas.numeric(), as.character(), as.vector(), as.matri......

  • 决策树模型比较:C4.5,CART,CHAID,QUEST

    (1)C4.5算法的特点为:输入变量(自变量):为分类型变量或连续型变量。输出变量(目标变量):为分类型变量。连续变量处理:N等分离散化。树分枝类型:多分枝。分裂指标:信息增益比率gain ratio(分裂后的目标变量取值变异较小,纯度高)前剪枝:叶节点数是否小于某一阈值。后剪枝:使用置信度法和减少......

  • R语言基础1

    ----------------------------------R语言学习与科研应用,科研作图,数据统计挖掘分析,群:719954246--------------------------我们将开始学习R语言编程,模式基本有两种,一种是在R语言命令提示符处直接输入相关语句直接运行,另一种是使用R......

  • r语言之生成规则序列,规则序列函数及用法

    在生成序列时,“:”的优先级最高(1)从1到20的整数序列:> 1:20 [1] 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20(2)用函数seq生成实数等差序列:(两种表示方法)seq(start,end,d)     ......

  • R语言编程

    R中的帮助文档非常有用,其中有四种类型的帮助help(functionname) 对已经加载包所含的函数显示其帮助文档,用?号也是一样的。help.search('keyword') 对已经安装的包搜索关键词,用??号功能一样。help(package='packagename') 显示已经安装的包......

  • [R]dplyr及ggplot2中的变量引用列的问题

    问题描述:存在这么一个场景,当需要动态选择列作为dplyr或ggplot2的输入时,列名的指定会出现问题。以iris举例:# 以iris dataset为例colnames <- c("Sepal.Length", "Sepal.Width", "Petal.Length","Petal.Wi......

  • R语言dplyr包初探

    昨天学了一下R语言dplyr包,处理数据框还是很好用的。记录一下免得我忘记了... 先写一篇入门的,以后有空再写一篇详细的用法。#dplyr learninglibrary(dplyr)#filter()#选择符合条件的数据框的行,返回数据框#Usage#filter(.data, ...) ......

  • CSS3重要内容翻译

    以上是废话1.3    此处未完全确认,相较于css3和css3的选择器,区别包括:基础定义改变(选择器、选择器组,简单选择器等),特别的,作为css2中简单选择器,如今被成为简单选择器序列,“简单选择器”作为这个序列的组成部分。允许在元素类型选择器上、通用选择器和类型选择器上增加可选的命名空间。一......

  • 转载:R语言Data Frame数据框常用操作

    Data Frame一般被翻译为数据框,感觉就像是R中的表,由行和列组成,与Matrix不同的是,每个列可以是不同的数据类型,而Matrix是必须相同的。Data Frame每一列有列名,每一行也可以指定行名。如果不指定行名,那么就是从1开始自增的Sequence来标识每一行。初始化使用data.f......

  • R语言data.table包fread读取数据

    R语言处理大规模数据速度不算快,通过安装其他包比如data.table可以提升读取处理速度。案例,分别用read.csv和data.table包的fread函数读取一个1.67万行、230列的表格数据。# 用read.csv读取数据timestart<-Sys.time()data <-......

  • R语言Data Frame数据框常用操作

    Data Frame一般被翻译为数据框,感觉就像是R中的表,由行和列组成,与Matrix不同的是,每个列可以是不同的数据类型,而Matrix是必须相同的。Data Frame每一列有列名,每一行也可以指定行名。如果不指定行名,那么就是从1开始自增的Sequence来标识每一行。初始化使用data.f......

  • R语言 data.frame 大全

    A data frame is used for storing data tables. It is a list of vectors of equal length. For example, the following variable df is a data frame containi......

  • R语言语法基础二

    R语言语法基础二重塑数据增加行和列# 创建向量city = c("Tampa","Seattle","Hartford","Denver")state = c("FL","WA","CT","CO")zipcode = c(33602, 98104, 06161, 80294)# 组合向量成数据帧a......

  • R语言学习之主成分分析法的R实践

    主成分分析R软件实现程序(一):>d=read.table("clipboard",header=T) #从剪贴板读取数据>sd=scale(d)  #对数据进行标准化处理>sd  #输出标准化后的数据和属性信息,把标准化的数据拷贝到剪贴板备用>d=read.table("c......

  • [R]R包版本更迭【持续更新】

    由于R版本更迭,网上或旧的教材上的包可能没有在维护,或者被其他包替代。做一个表记录碰到的一些替代方案。个人向,非完整指南。* mvpart2014年之后不再更新,R 3.0版本后无法安装, 提示 package ‘mvpart’ is not available (for R version 3.5......

  • 在Linux下安装R语言软件

    安装环境:centos、R3.0.11、在终端下下载:#cd /usr/local/#wget http://mirror.bjtu.edu.cn/cran/src/base/R-3/R-3.0.1.tar.gz  (终端下输入)2、解压文件:#tar -zxvf R-3.0.1.tar.gz#cd......

  • Hadoop与分布式数据处理 Spark VS Hadoop有哪些异同点?

    Spark是一个开源的通用并行分布式计算框架,由加州大学伯克利分校的AMP实验室开发,支持内存计算、多迭代批量处理、即席查询、流处理和图计算等多种范式。Spark内存计算框架适合各种迭代算法和交互式数据分析,能够提升大数据处理的实时性和准确性,现已逐渐获得很多企业的支持,如阿里巴巴、百度、网易、英特......

  • R语言-RStudio快捷键总结

    一、控制台功能  Windows & Linux   Mac移动鼠标到控制台 Ctrl+2 Ctrl+2移动到鼠标命令编辑 Ctrl+1 Ctrl+1控制台清屏 Ctrl+L Command+L移动鼠标至第一行 Home Command+Left移动鼠标至最后一行 End Command+R......

  • pycharm使用杂记

    R语言解释器在/opt/local/Library/Frameworks/R.framework/Versions/3.5/Resources/bin/R...