成都天府源码时代IT培训机构
全国服务热线:400-0859-208

成都天府python培训班学费一般多少

使用Python下载文件的简单示例

在本教程中,您将学习如何使用不同的Python模块从Web下载文件。此外,您还将下载常规文件、网页、AmazonS 3和其他来源。

较后,您将学习如何克服可能遇到的各种挑战,例如下载重定向文件、下载大型文件、完成多线程下载以及其他策略。

 

使用请求

您可以使用请求模块从URL下载文件。

考虑以下守则:

import requests
 
url = 'https://www.python.org/static/img/python-logo@2x.png'
 
myfile = requests.get(url)
 
open('c:/users/LikeGeeks/downloads/PythonImage.png', 'wb').write(myfile.content)

只需使用get 方法,并将结果存储到名为“myfile”的变量中。然后,将变量的内容写入文件中。

 

使用wget

还可以使用惠特Python模块。这个wget 可以使用PIP安装模块,如下所示:

pip install wget

考虑下面的代码,我们将下载Python的徽标图像:

import wget
 
url = "https://www.python.org/static/img/python-logo@2x.png"
 
wget.download(url, 'c:/users/LikeGeeks/downloads/pythonLogo.png')

在这段代码中,URL以及路径(图像将在其中存储)被传递给wget模块的下载方法。

 

重定向的下载文件

在本节中,您将学习如何从URL下载,该URL使用请求重定向到另一个带有.pdf文件的URL。URL内容如下:

https://readthedocs.org/projects/python-guide/downloads/pdf/latest/

要下载此pdf文件,请使用以下代码:

import requests
 
url = 'https://readthedocs.org/projects/python-guide/downloads/pdf/latest/'
 
myfile = requests.get(url, allow_redirects=True)
 
open('c:/users/LikeGeeks/documents/hello.pdf', 'wb').write(myfile.content)

在这段代码中,我们指定的步是URL。然后,我们使用请求模块的get方法来获取URL。在get方法中,我们设置allow_redirects到True,这将允许在URL中重定向,而重定向后的内容将分配给变量myfile.

较后,我们打开一个文件来编写获取的内容。

 

块下载大文件

考虑以下守则:

import requests
 
 
url = 'https://www.python.org/static/img/python-logo@2x.png'
 
 
myfile = requests.get(url)
 
 
open('c:/users/LikeGeeks/downloads/PythonImage.png', 'wb').write(myfile.content)

首先,我们像以样使用请求模块的get方法,但这一次,我们将流属性设置为True。

然后,我们在当前工作目录中创建一个名为PythonBook.pdf的文件,并打开它进行写入。

然后,我们指定要一次下载的块大小。我们已经设置为1024字节,遍历每个块,并在文件中写入块直到块完成。

不漂亮?别担心,我们稍后会显示下载过程的进度条。

 

下载多个文件(并行/批量下载)

若要一次下载多个文件,请导入以下模块:

import os
 
 
import requests
 
 
from time import time
 
 
from multiprocessing.pool import ThreadPool

我们导入了操作系统和时间模块,以检查下载文件所需的时间。模块ThreadPool 允许您使用池运行多个线程或进程。

让我们创建一个简单的函数,将响应以块的形式发送到文件:

def url_response(url):
 
 
    path, url = url
 
 
    r = requests.get(url, stream = True)
 
 
    with open(path, 'wb') as f:
 
 
        for ch in r:
 
 
            f.write(ch)

 

URL是一个二维数组,它指定要下载的页面的路径和URL。

urls = [("Event1", "https://www.python.org/events/python-events/805/"),
 
 
("Event2", "https://www.python.org/events/python-events/801/"),
 
("Event3", "https://www.python.org/events/python-events/790/"),
 
("Event4", "https://www.python.org/events/python-events/798/"),
 
("Event5", "https://www.python.org/events/python-events/807/"),
 
("Event6", "https://www.python.org/events/python-events/807/"),
 
("Event7", "https://www.python.org/events/python-events/757/"),
 
("Event8", "https://www.python.org/events/python-user-group/816/")]

将URL传递给requests.get,就像我们在上一节中所做的那样。较后,打开文件(URL中指定的路径)并写入页面的内容。

现在,我们可以对每个URL分别调用这个函数,也可以同时调用所有URL的这个函数。让我们在for循环中分别对每个URL执行此操作,并注意计时器:

start = time()
 
for x in urls:
 
 
url_response (x)
 
 
print(f"Time to download: {time() - start}")
 

现在,用以下代码行替换for循环:

 
ThreadPool(9).imap_unordered(url_response, urls)

运行脚本。

 

用进度栏下载

进度条是客户端模块的UI小部件。若要安装客户端模块,请键入以下命令:

pip install clint

考虑以下代码:

import requests
 
from clint.textui import progress
 
 
url = 'http://do1.dr-chuck.com/pythonlearn/EN_us/pythonlearn.pdf'
 
 
r = requests.get(url, stream=True)
 
 
with open("LearnPython.pdf", "wb") as Pypdf:
 
 
    total_length = int(r.headers.get('content-length'))
 
 
    for ch in progress.bar(r.iter_content(chunk_size = 2391975), expected_size=(total_length/1024) + 1):
 
 
if ch:
 
 
Pypdf.write(ch)

在这段代码中,我们导入了请求模块,然后从clint.textui导入了进度小部件。的区别是for循环。我们在将内容写入文件时使用了进度模块的BAR方法。

 

使用urllib下载网页

在本节中,我们将使用urllib下载一个网页。

urllib库是Python的标准库,因此不需要安装它。

以下代码行可以轻松下载网页:
urllib.request.urlretrieve('url''path')

在这里指定要保存的URL以及要存储它的位置:

urllib.request.urlretrieve('https://www.python.org/''c:/users/LikeGeeks/documents/PythonOrganization.html')

在这段代码中,我们使用了urlretrieve 方法并传递文件的URL,以及保存文件的路径。文件扩展名为.html。

 

通过代理下载

如果需要使用代理下载文件,可以使用ProxyHandler 在urllib模块中。检查以下代码:

import urllib.request
>>> myProxy = urllib.request.ProxyHandler({'http': '127.0.0.2'})
>>> openProxy = urllib.request.build_opener(myProxy)
>>> urllib.request.urlretrieve('https://www.python.org/')

 

在此代码中,我们创建了代理对象,并通过调用build_opener方法并传递代理对象。然后,我们请求检索页面。

此外,您还可以使用正式文档中记录的请求模块:
import requests
myProxy = { 'http': 'http://127.0.0.2:3001' }
requests.get("https://www.python.org/", proxies=myProxy)

 

使用urllib 3


urllib 3是urllib模块的改进版本。您可以使用pip下载并安装它:
pip install urllib3我们将获取一个网页,并使用urllib 3将其存储在文本文件中。
导入以下模块:

import urllib3, shutil

shutil模块在处理文件时使用。
现在,初始化URL字符串变量,如下所示:
url = 'https://www.python.org/'然后,我们使用PoolManager 用于跟踪必要的连接池的urllib 3。

c = urllib3.PoolManager()创建一个文件:

filename = "test.txt"

较后,我们发送一个GET请求来获取URL并打开一个文件并将响应写到该文件中:
with c.request('GET', url, preload_content=False) as res, open(filename, 'wb') as out_file:
shutil.copyfileobj(res, out_file)

 

使用Boto 3从S3下载文件


要从AmazonS 3下载文件,可以使用PythonBoto 3模块。
在开始之前,您需要使用pip安装awscli模块:
pip install awscli对于AWS配置,运行以下命令:

aws configure现在,输入您的详细信息如下:

AWS Access Key ID [None]: (The access key)
AWS Secret Access Key [None]: (Secret access key)
Default region name [None]: (Region)
Default output format [None]: (Json)
要从AmazonS 3下载文件,请导入boto 3和botocore。Boto 3是用于Python访问AmazonWeb服务(如S3)的AmazonSDK。Botocore提供命令行服务来与AmazonWeb服务交互。
Botocore配备了awscli。要安装boto 3,运行以下命令:
pip install boto3现在,导入这两个模块:

import boto3, botocore当从Amazon下载文件时,我们需要三个参数:
桶的名字
需要下载的文件的名称。
文件下载后的名称。
初始化变量:
bucket = "bucketName"
file_name = "filename"
downloaded_file = "downloadedfilename"

现在,初始化一个变量以使用会话的资源。为此,我们将调用resource()方法并传递服务,即S3:

service = boto3.resource(‘s3’)

较后,使用download_file 方法并传入变量:

service.Bucket(bucket).download_file(file_name, downloaded_file)

 

使用异步


异步模块的重点是处理系统事件。它围绕一个事件循环工作,该循环等待事件发生,然后对该事件作出反应。反应可以是调用另一个函数。这个过程叫做偶数处理。异步模块使用协同处理事件。
为了使用异步事件处理和协同服务功能,我们将导入异步模块:
import asyncio现在,定义异步协同器方法,如下所示:

async def coroutine():
    await my_func()
关键字异步告诉我们,这是一个本机异步协同器。在协同线的主体中,我们有一个等待关键字,它返回一个特定的值。返回关键字也可以使用。
现在,让我们使用Cooutine创建一个代码,从Web下载一个文件:
>>> import os

>>> import urllib.request

>>> async def coroutine(url):

    r = urllib.request.urlopen(url)

    filename = "couroutine_downloads.txt"

    with open(filename, 'wb') as f:

        for ch in r:

            f.write(ch)

    print_msg = 'Successfully Downloaded'

    return print_msg

>>> async def main_func(urls_to_download):

    co = [coroutine(url) for url in urls_to_download]

    downloaded, downloading = await asyncio.wait(co)

    for i in downloaded:

        print(i.result())

urls_to_download = ["https://www.python.org/events/python-events/801/",

"https://www.python.org/events/python-events/790/", 

"https://www.python.org/events/python-user-group/816/",

 "https://www.python.org/events/python-events/757/"]

>>> eventLoop = asyncio.get_event_loop()

>>> eventLoop.run_until_complete(main_func(urls_to_download))
在这段代码中,我们创建了一个异步协同函数,用于下载我们的文件并返回一条消息。
然后,我们有另一个异步协同器调用main_func 它等待URL并生成所有URL的队列。异步的等待函数等待协同器的完成。
现在,要启动coroutine,我们必须将coroutine放入事件循环中,方法是使用get_event_loop()方法,较后,使用run_until_complete()异步方法


使用Python下载文件很有趣。希望这个教程对你有用!

#标签:Python,Python下载文件

互联网时代 人工智能无处不在
  • 无人驾驶技术
  • 智能人脸识别
  • 微软小冰
  • 搜索引擎
  • IBM Waston
  • Siri
  • 智能设计
  • 谷歌AlphaGo
全栈开发 选Python语言 未来大有可为
  • 热门语言之一
  • 应用极广
  • 就业前景
    极好
  • 简单易学
  • 企业越来越热衷的语言
  • Python是世界排名第三的编程语言,使用人数超过千万,30%IT新人入门都学Python。它作为一门编程语言,其魅力远超C#、Java、C、C++,它被昵称为“胶水语言”,更被热爱它的程序员誉为“较美丽的”编程语言。
  • Python无所不能,应用范围覆盖web编程、黑客编程、爬虫编写、机器学习、人工智能、系统运维、 图形处理、数据库编程、网络编程。Python使用场景广泛,拥有众多第三方库,胶水语言适应多种编程需求。
  • Python人才缺口高达40万,部分领域如人工智能、大数据开发人才稀缺, 年薪二十万都招不到专业人才。
  • B2C电商平台项目,爱购网上商城是一个综合性的B2C平台,类似京东商城、天猫商城。会员可以在商城浏览商品、下订单等。Mycat分表,分布式缓存Redis,微信支付/支付宝支付 FastDFS云存储,流量控制、分布式事务
  • Python的应用特别广,中国现在的人才缺口超过100万,:豆瓣、搜狐、金山、通讯、盛大、网易、百度、阿里、土豆、新浪等,国外:谷歌、NASA、YouTube、Facebook、红帽等企业都在广泛应用,尤其是Linux运维、web开发、大数据、人工智能等等。
全栈开发 选Python语言 未来大有可为
"无所不能" 的编程语言 只有想不到,没有做不到
  • Python Web开发工程师
  • Python爬虫开发工程师
  • Python大数据工程师
  • Python自动化运维工程师
  • Python自动化测试工程师
  • Python人工智能工程师
  • Python Web开发工程师
    我们都知道Web网站开发一直都是所有互联网公司开发的重点之一,我们离不开互联网,离不开Web技术,利用Python的Web框架可以迅速开发Web应用。
  • Python爬虫开发工程师
    在当前信息大爆炸时代,大量的信息都通过Web来展示,为了获取这些数据网络爬虫工程师应运而生,除了日常的抓取数据和解析数据的需求,还能够突破普通网站常见的反爬虫机制,以及更深层次的爬虫采集算法的编写。
  • Python大数据工程师
    在大数据时代,数据是公司的核心资产,从杂乱无章的数据中提取有价值的信息或者规律,成为了数据分析师的首要任务,而Python的工具链为这项繁重的工作提供了极高的效率支持。
  • Python自动化运维工程师
    大型网站系统是公司业务发展的核心支撑,增加系统的稳定性是运维工程师工作的重中之重,Python语言可以满足Linux运维工程师工作中的所有需求。在当前分布式系统架构流行的时代,自动化运维是Python开发的主要任务。
  • Python自动化测试工程师
    自动化测试 是把以人为驱动的测试行为转化为机器执行的一种过程,在此过程中,为了节省人力、时间或硬件资源,提高测试效率,便引入了自动化测试的概念。在公司开发大型系统过程中,漏洞和缺陷是不可避免的,由于Python提供了多元自动化测试的模块,于是Python自动化测试工程师的市场需求逐年上升。
  • Python人工智能工程师
    人工智能的迅速发展将深刻改变人类社会生活、改变世界。 为抢抓人工智能发展的重大战略机遇,构筑我国人工智能发展的先发优势,加快建设创新型和世界科技强国,当前人工智能发展进入新阶段。
学习“Python+人工智能”谁更合适?
  • 逻辑思维能力强
    如果你对Python这门语言感兴趣,并认为自己的逻辑思维能力比较强,想学会一门高薪技能!那不妨来试一试,很可能它将成为你一生的高薪职业饭碗。
  • 网络运维转开发
    如果你是从事传统网络运维工作,想要转型做开发,那你适合学Python。
  • 偏爱前端开发
    如果你想做web前端开发工程师,又不想仅限于H5、CSS3开发,那么Python将是你的不二之选。
  • 立志做全能型人才
    如果你立志做一个全能型人才,一人搞定前后端,那么Python是你成功的选。
  • 大数据人才转行
    如果你是大数据相关专业的学生或人员,想学习一门比较有前景的语言,Python无疑是你职业生涯不错的选择。
  • 其他编程语言转行
    如果你觉得现在的职业做烦了,职业发展受限,想转行!那你可以果断转行Python。
掌握前沿技术 提高职业竞争力
掌握前沿技术 提高职业竞争力
  • 阶段:Python基础编程

    Python基础编程

    开启编程之路
    Python语法
  • 第二阶段:Python编程

    Python编程

    Linux基础操作
    Python编程
  • 第三阶段:H5移动开发

    H5移动开发

    HTML5+CSS3
    JavaScript+AJAX
    jQuery和Bootstrap
    移动端电商项目
  • 第四阶段:数据库编程

    Python基础编程

    数据库编程
    MySQL
    MongoDB
    Redis
  • 第五阶段:后端大项目实战

    后端大项目实战

    Django
    移动端购物网站
    Flask框架
    微信公众号开发
  • 第六阶段:网络爬虫

    网络爬虫

    Python爬虫
    scrapy框架和scrapy-redis
  • 第七阶段: shell和自动化运维

    shell和自动化运维

    Shell编程
    Nginx
    自动化部署
  • 第八阶段:高薪课程

    高薪课程

    数据分析
    机器学习算法
    大数据与人工智能
  • 第九阶段:就业内容

    就业内容

    就业指导
    面试直通车
    售后服务
全程项目驱动式教学 学习效果更佳
  • 微信打飞机游戏小程序
  • 移动电商平台
  • 微信公众号开发在线点餐预定系统
  • 旅游网站爬虫应用
  • 金牛座智能盈利策略
  • 人脸识别汽车牌照识别
  • 【项目描述】
    人脸识别(Face Recognition)实现了图像或视频中人脸的检测、分析和比对,包括人脸检测定位、人脸属性识别和人脸比对等独立服务模块,可为开发者和企业提供高性能的在线API服务,应用于人脸AR、人脸识别和认证、大规模人脸检索、照片管理等各种场景。
    【应用的技术】
    TensorFlow框架开发;Tensorflow IO操作。
    【学后能够做什么】
    图像识别,去重操作,汽车牌照识别。
  • 【项目描述】
    移动端的电子商务网站是当前互联网中较有代表的产品!该项目使用到Django的开发框架。购物网站模仿京东和淘宝业务流程,真正适合大型电商的业务流程。
    【应用的技术】
    Django,MySQL,Redis,Linux,所有的前端技术。
    【学后能够做什么】
    电子商务网站应用到了所有的WEB开发技术,掌握了这些技术从而可以开发出各种类型的WEB网站
  • 【项目描述】
    为了解决园区或者商场就餐排队等待的问题,同时为客户节约时间,为餐馆解决人力成本。该系统中有自动下单,在线支付,在线优惠以及各种拼单功能。
    【应用的技术】
    Python编程语法基础,数据库,django,Linux。
    【学后能够做什么】
    基于微信的各种O2O应用。
  • 【项目描述】
    旅游线路,酒店预订,旅游攻略等其他内容的爬虫。
    【应用的技术】
    Python编程语法基础,数据库,django,Linux,scrapy框架。
    【学后能够做什么】
    各种分类信息的爬虫以及数据分析。
  • 【项目描述】
    接收市场行情数据, 生成K线数据并产生交易提醒。根据交易策略, 寻找获利机会并做出开仓/平仓, 止损/止盈等决策。
    【应用的技术】
    Python编程语法基础,数据库,django,Linux,scrapy框架,pandas,tushare,requests,matplotlib。
    【学后能够做什么】
    大数据分析和自动化交易类型的软件。
  • 【项目描述】
    人脸识别(Face Recognition)实现了图像或视频中人脸的检测、分析和比对,包括人脸检测定位、人脸属性识别和人脸比对等独立服务模块,可为开发者和企业提供高性能的在线API服务,应用于人脸AR、人脸识别和认证、大规模人脸检索、照片管理等各种场景。
    【应用的技术】
    TensorFlow框架开发;Tensorflow IO操作。
    【学后能够做什么】
    图像识别,去重操作,汽车牌照识别。
在这里你可以收获
  • LECTURER
    互联网企业专业讲师授课
  • ACTUAL COMBAT
    2—3年的Python实战开发经验
  • EMPLOYMENT
    的终身就业服务与职业规划
  • UPGRADE
    任何新升级的课程资料与技术讲座
  • RESOURCES
    一群志同道合的同学以及人脉资源
  • FREE OF CHARGE
    终身0元的技术支持
我们的服务让你更放心学习
  • NO. 1
    全新课程,紧跟Python以及人工智能技术,直击企业核心需求
  • NO.2
    大牛讲师全程面授,增加你的学习效果,正课时间每天不少于8小时
  • NO.3
    技术辅导老师团队全天陪伴,不懂问题立马解决
  • NO.4
    每一阶段针对学员所学课程内容作阶段性测试,测试不合格,要求重听
  • NO.5
    全程军事化管理,让你每天的时间除了吃饭都浸泡在学习中
  • NO.6
    教学过程中以学员为主体,确保每一位学员:听得懂、学的会、用的精
免费课程预约
每天限量名额,先到先得
二维码

扫一扫 免费领取试听课

尊重原创文章,转载请注明出处与链接:http://www.peixun360.com/news/503051/违者必究! 以上就是成都天府源码时代IT培训机构 小编为您整理成都天府python培训班学费一般多少的全部内容。

版权所有:培训指南(www.peixun360.com) 技术支持:培训指南网

温馨提示:提交留言后老师会第一时间与您联系!热线电话:400-0859-208