CJH's blog

发表于2023-03-08|文学创作

一、嫦娥奔月各个版本 1.1原装正版相传在远古的时候，天上突然出现了十个太阳，晒得大地直冒烟，老百姓实在无法生活下去了。有一个力大无比的英雄名叫后羿，他决心为老百姓解除这个苦难。后羿登上昆仑山顶，运足气力，拉满神弓，“嗖——嗖——嗖——”一口气射下九个太阳。他对天上最后一个太阳说：“从今以后，你每天必须按时升起，按时落下，为民造福。” 后羿为老百姓除了害，大伙儿都很敬重他。很多人拜他为师，跟他学习武艺。有个叫逄蒙的人，为人奸诈贪婪，也随着众人拜在后羿的门下。后羿的妻子嫦娥（原名：姮娥），是个美丽善良的女子。她经常接济生活贫苦的乡亲，乡亲们都非常喜欢她。一天，昆仑山上的西王母送给后羿一丸仙药。据说，人吃了这种药，不但能长生不老，还可以升天成仙哩。可是，后羿不愿意离开嫦娥，就让她将仙药藏在百宝匣里。这件事不知怎么被逄蒙知道了，他一心想把后羿的仙药弄到手。八月十五这天清晨，后羿要带弟子出门去，逄蒙假装生病，留了下来。到了晚上，逄蒙手提宝剑，迫不及待地闯进后羿家里，威逼嫦娥把仙药交出来。嫦娥心里想，让这样的人吃了长生不老药，不是要害更多的人吗。于是，她便机智地与逄蒙周旋。逄蒙见嫦娥不肯 ...

24考研计划

发表于2023-02-20|考研

24考研计划广东工业大学软件工程20届学生，计划23年2月开始准备考研。保研由于卷王过多且本人绩点不高，没有过多两眼的科创加分，所以准备考研了呜呜呜。英语复习计划时间安排 2-3月：每天15分钟字帖，20分钟左右的背单词。一周写一套六级真题。 3~6月：每天15分钟字帖，20分钟左右的背单词。一周写两套左右六级真题，也可以针对部分内容强化复习。 7~10月：稳固复习，强化作文等专项训练。 10~12月：冲刺。资料安排英文字帖：墨点字帖考研真相：【全部现货】2024考研真相英语一/24考研英语二全套2023圣经一二历年真题英语解析试卷基础研读版+高分突破+考前冲刺搭词汇闪过-tmall.com天猫数学复习计划时间安排 2~3月：成功过一遍金榜的所有数学基础题，并开始写些老年代的原题。 3~6月：做提高篇， 7~10月：强化，刷题 10~12月：补充，冲刺因为22年11月为了参加数学竞赛，已经算是狠狠过了一遍高数。，所以可以多花点时间在薄弱的学科里。资料《【限时包邮赠历年真题＋公式手册】2023李永乐考研数学复习全书基础篇+基础过关660题+ ...

数据预处理概念

发表于2023-01-29|数据挖掘

数据预处理概念篇数据预处理的目的是，对原始数据进行预处理，以提高数据质量，提高学习算法的准确性、有效性和可伸缩性，达到简化学习模型和提高算法的泛化能力。常用的数据预处理技术包括：数据清理数据变换数据归约数据离散化特征选择 1、数据集类型三个重要特征维度：数据集中的对象具有的属性个数总合稀疏性：有意义数据的占比。分辨率：观察深度。三类数据集：记录数据：事物数据/购物篮数据数据矩阵基于图形的数据有序数据：时序数据：序列数据：生物学序列，购物单时间序列数据：股票，库存控制空间数据：空间自相关，地理系统，医学图像流数据：电力供应，银行 2、数据统计特性数据统计又称为汇总统计中心趋势度量：均值（mean）算术均值： x‾=∑i=1NxiN=x1+x2+…+xNN\overline{x} = \frac{\sum_{i=1}^{N}{x_i}}{N} = \frac{x_1 + x_2 + \ldots + x_N}{N} x=N∑i=1Nxi=Nx1+x2+…+xN 加权算数均值（带权重）： x‾=∑i=1 ...

图片爬取

发表于2022-12-15|数据挖掘

图片爬取在爬得书本数据后，不是有一个图片的img地址嘛~ 我们还可以把他保存至本地，本次就教大家将网上的图片，批量拉进自己的电脑 1 库与数据的导入 1234import pandas as pdimport requestsimport timedata = pd.read_csv("book_data_2.csv") 其中国data.iloc[0][4]为图片地址类似: 1'https://img2.doubanio.com/view/subject/s/public/s34327482.jpg' 2 爬取并转换为二进制保存 123456789for i in range (0,len(data)): url = data.iloc[i][4] r = requests.get(url) time.sleep(0.2) # 防止被捕 path = "./image/" + str(data.iloc[i][0]) + ".jpg" # 名字与地址 with open(p ...

腾讯云从业者认证学习笔记

发表于2022-11-29|腾讯实验班

腾讯云从业者认证学习笔记前言我的成绩相关链接：腾讯云从业者认证【限时免费】腾讯云从业者认证课程 - 腾讯产业互联网学堂 (tencent.com) 模拟考试认证概述腾讯云从业者认证是云计算行业从业者的初级技能认证, 通过该认证可有效验证您是否具备掌握云计算基础知识以及理解腾讯云基础产品的功能和使用场景的能力。适用于初入云计算行业, 计划从事售前工作, 或逐步向运维、架构等角色提升的人员。该认证需要学员提前报名, 在腾讯云官方授权的考试中心进行。适合对象正在从事或有志于从事云计算相关岗位的学生或IT从业者；具有计算机、网络通信、数据处理等领域的学习或工作经验；对虚拟化、服务器、存储、网络、数据库、安全等基本概念有所了解；课程目录考试内容知识域百分比知识点云计算基础 30% 1.1 计算发展历史 1.2 云计算的技术架构 1.3 云计算的影响 1.4 业界主流云产品腾讯云产品基础知识 70% 2.1 腾讯云云网络, 云CDN, 云存储, 云数据库, 云安全产品功能、优势和适用场景 2.2 腾讯云云网络, 云CDN, 云存储, 云数 ...

腾讯云人工智能从业者认证（TCA）学习笔记

发表于2022-11-29|腾讯实验班

腾讯云从业者认证学习笔记前言相关链接：腾讯云从业者认证【限时免费】腾讯云从业者认证课程 - 腾讯产业互联网学堂 (tencent.com) 模拟考试认证概述腾讯云从业者认证是云计算行业从业者的初级技能认证, 通过该认证可有效验证您是否具备掌握云计算基础知识以及理解腾讯云基础产品的功能和使用场景的能力。适用于初入云计算行业, 计划从事售前工作, 或逐步向运维、架构等角色提升的人员。该认证需要学员提前报名, 在腾讯云官方授权的考试中心进行。适合对象正在从事或有志于从事云计算相关岗位的学生或IT从业者；具有计算机、网络通信、数据处理等领域的学习或工作经验；对虚拟化、服务器、存储、网络、数据库、安全等基本概念有所了解；我的得分课程目录考试内容知识域百分比知识点云计算基础 30% 1.1 计算发展历史 1.2 云计算的技术架构 1.3 云计算的影响 1.4 业界主流云产品腾讯云产品基础知识 70% 2.1 腾讯云云网络, 云CDN, 云存储, 云数据库, 云安全产品功能、优势和适用场景 2.2 腾讯云云网络, 云CDN, 云存储, 云数 ...

爬取豆瓣各类别书籍及处理数据（全流程）

发表于2022-11-08|项目实战

1 前言豆瓣作为爬虫手们的入手网站，十分的受欢迎。这次我使用xpath这个简单的技术进行爬取。目的就是为了给数据库大作业–图书管理系统做铺垫。本次代码大概花了我4个小时，主要是中间处理数据的时候失误了，有时是标点错误，以及忘记错误处理这种好方法，最终我们爬取了将近12000本书，处理之后得到6983本书，足够我们使用。使用工具如下： windows 11 python 3.9 Microsoft Edge pandas（数据处理） math（数学计算） time（时间库，休眠用防封IP） requests（请求库） lxml.etree（html文本转化）所爬取网站（按顺序）为：豆瓣图书标签 (douban.com) 豆瓣图书标签: 小说 (douban.com) 2 引入相关库 123456789import requests from lxml import etreeimport pandas as pdimport mathimport timeheaders = {'User-Agent': 'User-Agent:Mozill ...

pymysql操作

发表于2022-11-08|数据库

Python进阶知识全篇-MySQL（PyMySQL） - 知乎 (zhihu.com) 什么是 PyMySQL？ PyMySQL 是在 Python3.x 版本中用于连接 MySQL 服务器的一个库，Python2中则使用mysqldb。 PyMySQL 遵循 Python 数据库 API v2.0 规范，并包含了 pure-Python MySQL 客户端库。 PyMySQL 安装在使用 PyMySQL 之前，我们需要确保 PyMySQL 已安装。 PyMySQL 下载地址：https://github.com/PyMySQL/PyMySQL。如果还未安装，我们可以使用以下命令安装最新版的 PyMySQL： 1$ pip3 install PyMySQL 如果你的系统不支持 pip 命令，可以使用以下方式安装： 1、使用 git 命令下载安装包安装(你也可以手动下载)： $ git clone https://github.com/PyMySQL/PyMySQL $ cd PyMySQL/ $ python3 setup.py install 2、如果需要制定版本号，可以使 ...

全球反恐状况分析

发表于2022-11-02|腾创实验班

0 实验内容根据一项调查，每年约有2.18亿人受到自然和人为灾害的影响，每年约有68000人失去生活。地震、火山等自然灾害的频率基本保持不变，但在此期间恐怖活动的数量有所增加。本实验的目的是探索世界各地的恐怖事件。我们将探讨恐怖主义的趋势、恐怖主义多发地区等。 1 开发准备 1.1 数据集准备数据地址数据集有1个，名字叫globalterrorismdb_0617dist.csv。原数据集记录了1970.1.1 2017.1.27之间的恐怖主义事件，由于原数据集太大，本实验的数据集截取了2016.1.1 2017.1.27之间的恐怖主义事件。 1.2 数据集解释数据集存储的是恐怖主义事件的数据，包含恐怖事件发生的时间、国家、地区、攻击类型、目标人群、死亡人数、受伤人数、动机、城市、经度、维度等共135个字段。由于数据集有135个字段，无法展示。后面的步骤会从数据集中筛选重要的字段，并展示数据集的前5行数据，同学们可以通过它了解数据集。 1.3 导入包和数据集导入包和数据集，代码如下： 123456789# import librariesimport numpy as n ...

天池汽车竞品分析攻略

发表于2022-10-31|项目实战

一、赛题内容数据分析达人赛：汽车产品聚类分析实验环境：天池notebook 赛题背景赛题以竞品分析为背景，通过数据的聚类，为汽车提供聚类分类。对于指定的车型，可以通过聚类分析找到其竞品车型。通过这道赛题，鼓励学习者利用车型数据，进行车型画像的分析，为产品的定位，竞品分析提供数据决策。竞品：指产品在同领域的竞争对手。如肯德基与麦当劳。赛题数据数据源：car_price.csv，数据包括了205款车的26个字段 1 Car_ID 每个观测值的唯一 ID（英格） 2 Symboling 其分配的保险风险评级，值为+3表示汽车有风险，-3表示它可能非常安全。（分类） 3 CarName 汽车公司名称（分类） 4 fueltype 汽车燃料类型，即汽油或柴油（分类） 5 aspiration 汽车中使用的吸气（分类） 6 doornumber 汽车车门数（分类） 7 carbody 车身（分类） 8 drivewheel 驱动轮类型（分类） 9 enginelocation 汽车发动机的位置（分类） 10 wheelbase 汽车底座 ...