Posts
PyTorch系列 - 基础入门
··3260 字
深度学习
PyTorch
了解 PyTorch 的基础知识,包括张量(Tensor)、其操作以及一些常见的功能。
深度学习-基础知识
·1488 字
深度学习
持续更新中…
XGBoost
··4566 字
机器学习
XGBoost
GBDT
XGBoost(eXtreme Gradient Boosting)是一种基于梯度提升(Gradient Boosting)的机器学习算法。
随机森林
·3325 字
机器学习
随机森林
随机森林(Random Forest)是一种常用的集成学习方法。
线性回归与逻辑回归
·3406 字
机器学习
统计学习
线性回归
逻辑回归
本文详细介绍了线性回归和逻辑回归的基本概念、假设、目标、模型评价指标、多重共线性问题以及评估指标。
PyTorch系列 - 环境配置
··864 字
深度学习
PyTorch
本文介绍如何在 Mac 上安装 PyTorch,并利用 Apple 芯片的 Metal 框架进行加速。
Spark系列 - 数据合并
·2309 字
大数据
Spark
DataFrame
本文介绍了 Spark 中的几种常见 Join 操作,包括 Inner Join、Outer Join、Left Join 和 Right Join,以及它们的具体实现和优化方法。
Spark系列 - 数据聚合
·1170 字
大数据
Spark
DataFrame
聚合
探索Spark中的聚合与窗口函数,涵盖简单聚合、分组聚合、窗口聚合等操作。
Spark系列 - 数据转换(II)
·2008 字
大数据
Spark
DataFrame
SparkSQL
withColumn
Transformations
本章主要讨论 Spark 的数据转换。
Python系列 - 单元测试
·1986 字
Python
Python开发
unittest
Python 自带的
unittest
模块提供了一个全面的框架,用于编写和运行测试。
Spark系列 - 数据转换(I)
·2750 字
大数据
Spark
DataFrame
SparkSQL
Transformations
本章主要讨论 Spark 的数据转换。
Python系列 - 动态规划
·2966 字
Python
动态规划
Python算法
1. 动态规划介绍 # 动态规划(Dynamic Programmin
Python系列 - 滑动窗口
·1059 字
Python
滑动窗口
Python算法
滑动窗口是一种常用于数组或字符串的算法技巧,它通过在数组或字符串上维护一个窗口。
Python系列 - 递归函数
·2425 字
Python
递归
栈
Python算法
如果一个函数在内部调用自身本身,那么这个函数就是递归函数。
Spark系列 - 数据存储
·1316 字
大数据
Spark
DataFrame
SparkSQL
分布式数据库
本章主要讨论 pySpark 的数据存储。
Spark系列 - 数据读取
·2470 字
大数据
Spark
DataFrame
SparkSQL
分布式数据库
本章主要讨论 pySpark 的数据读取。
Spark系列 - 配置Spark
·1559 字
大数据
Spark
日志
Log4J
硬编码
软编码
本文将详细介绍如何在 Spark 项目中配置 Log4J 日志模块,以及配置 Spark Session。
Spark系列 - 本地环境的搭建
·544 字
大数据
Spark
环境安装
本篇文章将介绍如何在本地 Mac 环境下搭建 Spark,包括安装 JDK、配置环境变量、安装和配置 Spark 以及安装 PySpark。
Spark系列 - 初识大数据
·2952 字
大数据
Spark
Hadoop
数据库
这篇文章初步介绍了大数据、Hadoop 和 Spark 这三个关键方面。本文提供了一个简要的概述,为读者进一步了解大数据处理提供了基础。
AB测试系列 - AB测试里的统计学 PART 2
·2670 字
AB测试
统计
数据分析
本文主要讨论在AB测试中遇到的统计学知识点,主要包括:最小样本量计算、实验时间计算、以及一些其他相关的统计知识点。
AB测试系列 - AB测试里的统计学 PART 1
·3793 字
AB测试
统计
数据分析
本文主要讨论在AB测试中遇到的统计学知识点,主要包括:效应大小、MDE、置信区间、假设检验等等。
AB测试系列 - 如何提升测试的可靠性
·4400 字
AB测试
统计
数据分析
本文主要讨论如何去确保AB测试的有效性,简单地开启AB测试无法保证其实验结果是否有效,需要结合具体的业务场景及一些科学的方法进行验证。
AB测试系列 - 理清业务问题
·3940 字
AB测试
统计
数据分析
在做AB测试前,我们必须要理清业务相关的问题。这方面会涉及到公司层面、产品层面、功能层面等相关重要的内容及指标,本文会对这方面做出详细的介绍。
SQL系列 - 查询语句
··3747 字
SQL
数据库
数据分析
本文主要描述如何对 SQL 里的数据进行查询。
SQL系列 - 操作语句(增、删、改)
·1373 字
SQL
数据库
数据分析
本文主要描述如何对 SQL 里的数据进行操作,例如:增加数据、删除数据、修改数据等等。
SQL系列 - 创建数据库与数据表
·2896 字
SQL
数据库
数据分析
本文主要描述如何创建数据库、数据表、以及相关的约束和数据类型。