pyspark系列文章是本人根据《PySpark实战指南》学习pyspark中学习笔记,这本书是一本译文,有些地方感觉有点小问题,不过在本人的这些笔记中都是亲自测试跑通后的小例子。仅作参考和学习。 1.概述 MLlib概括了单个核心机器学习功能࿱…
2025/1/7 8:24:41首先回顾一下,协同过滤算法主要有两种,一种是基于用户的协同过滤算法(UserCF),另一种是基于物品的协同过滤算法(ItemCF)。 基于用户的协同过滤算法主要有两步: 1)找到和目…
2025/1/7 7:04:21它们是存储单位 因为计算机存储单位一般用B,KB、MB、GB、TB、PB、EB、ZB、YB、BB来表示,它们之间的关系是: 位 bit (比特)(Binary Digits):存放一位二进制数,即 0 或 1,最小的存储单位. 字节 byte:8个二进制位为一个字节(B),最常用的单位. 1K…
2025/1/7 6:31:53一、代理模式关于代理模式,以及代理模式的组成元素、类图关系、优点以及应用场景可以参考我的上一篇博文 代理模式简介二、静态代理 1.定义所谓静态代理,即是代码编译时已经写好了代理类。例如我们上一章介绍的例子就是静态代理。 2.举个例子现在又一个共…
2025/1/7 5:02:15这些工具可以实现图像混合和遮罩功能,这些功能在图像处理应用程序(如GIMP、Krita或Photoshop)中很常见。有关基于此功能的分层图像合成GUI,请参阅下面链接的工具箱。 These tools effect image blending and masking functionali…
2025/1/7 8:08:57 人评论 次浏览Mysql隔离性之事务隔离级别 四种隔离级别(SQL 92标准): Mysql提供了四种隔离级别(低—>高): Read uncommitted(读未提交):最低级别,任何情况都不能满足&a…
2025/1/7 4:20:47 人评论 次浏览增量爬虫 在scrapy中有很多的爬虫模版,这些模版都是基于basic模版进行的功能扩展(例如:crawl模版、feed模版等)最常用的是crawl(即增量式爬虫) basicspider的设计理念是:从start_urls里面取出起…
2025/1/7 3:10:15 人评论 次浏览Regionals 1996 >> North America - Mid-Atlantic USA 问题链接:UVALive5429 UVA382 POJ1528 HDU1323 ZOJ1284 Perfection。入门练习题,用C语言编写程序。 一个数的真因数之和等于本身的数称为完美数。例如6=1&a…
2025/1/7 2:43:30 人评论 次浏览5分钟了解线程池 老王是个深耕在帝都的一线码农,辛苦一年挣了点钱,想把钱存储到银行卡里,拿钱去银行办理遇到了如下的遭遇 老王银行门口取号后发现有柜台营业但是没人办理业务直接办理了。老王取号后发现柜台都有人在办理,等待席有空地,去坐着等办理去了。老王取号后发现…
2025/1/7 8:25:56 人评论 次浏览MFC中的位图操作,涉及三个概念:CBitmap,HBitmap,BITMAP. 1.BITMAP是位图的基本数据结构,封装位图信息,包括颜色,大小,位值,数据等 12345678910typedef struct tagBITMAP { int bmType; int bmWidth; //宽 int bmHeight; //高 int bmWidthBytes; BYTE …
2025/1/7 8:25:25 人评论 次浏览1. 非齐次线性方程组有解的充要条件是常数项向量可由系数矩阵列向量组线性表出或增广矩阵的秩等于系数矩阵的秩; 非齐次线性方程组的导出组的概念 2. 非齐次方程组解的性质 3. 非齐次方程组的任一解可表达为其某个特解与导出组的某一解之和 4. 非齐次方程组的通解…
2025/1/7 8:24:54 人评论 次浏览环境 SQL版本:MSSQL2005 IDE版本:Visual Studio2010 OS:win7 第一步:找到asp_regsql.exe所在位置,一般位为windows\\microsoft.net\\framwork\\版本 第二步:运行CMD,将路径转换到1 第三步:为SQL缓存依赖项启用database数据库 aspnet_regsql -S localhost -E -d database -ed 第…
2025/1/7 8:24:24 人评论 次浏览什么是逆元 当求解公式:(a/b)%m 时,因b可能会过大,会出现爆精度的情况,所以需变除法为乘法: 设c是b的逆元,则有b*c≡1(mod m); 则(a/b)%m (a/b)*1%m (a/b)*b*c%m a*c(mod m); 即a/b的模等于a…
2025/1/7 8:23:53 人评论 次浏览日期和时间在程序中应用广泛,每种程序开发语言都自带处理日期和时间的相关函数,很多开发者把日期和时间存入数据库中,但是,一旦涉及到跨时区的日期和时间的处理时,大多数开发者根本就不明白如何正确地处理日期和时间。…
2025/1/7 8:23:22 人评论 次浏览Spark_飞机项目 首先将csv文件变成UTF-8scala> val flightssc.textFile("/data/USA_Flight") scala> flights.take(3) val df spark.read.format("csv").option("header",true).load("/data/USA_Flight") 重新定义英文名 scala…
2025/1/7 8:07:28 人评论 次浏览1. 写在前面 最近需要用到HQL语句做一些数据分析的工作,又发现了自己的短板, HQL这个东西用起来并不是很流畅,虽然建表,查询的基本语句还能应付(这还是吃的大学的SQL基础老本), 但涉及到一些复杂的查询等就不行了&…
2025/1/7 8:05:14 人评论 次浏览简述: 渐渐的在开发道路上更注重App的性能, 数据的预加载的处理。在日常开发APP,一个Activity里面有可能会是有Viewpager与多个Fragment来进行组合,而如果每个Fragment都需要通过网络加载数据,或加载本地缓存。 如果当…
2025/1/7 8:19:15 人评论 次浏览一般来说,只有当sharepoint server中存在两个及两个以上的server时才可能出现这种情况。 解决方法就是用代码来部属solution时,添加上-url参数来指定web application! "%systemdrive%\Program Files\Common Files\Microsoft Shared\web …
2025/1/7 8:13:53 人评论 次浏览VMware虚拟机运行虚拟系统时显示“内部错误”的解决方法参考文章: (1)VMware虚拟机运行虚拟系统时显示“内部错误”的解决方法 (2)https://www.cnblogs.com/hoperoad/p/9678910.html 备忘一下。
2024/11/2 0:58:08 人评论 次浏览我想为网络图设置动画以显示算法的进度.我正在使用NetworkX进行图表创建.从this SO answer开始,我想出了一个解决方案,使用来自IPython.display的clear_ouput和命令plt.pause()来管理动画的速度.这适用于具有少量节点的小图,但是当我在1010网格上实现时,动画非常慢并且减少了pl…
2024/12/10 12:59:09 人评论 次浏览