使用Apache HttpClient实现多线程下载的小例子

简介:
 

网上类似的文章很多,参考了很多人的,大部分人都是用URLConnection写的。

原理一:HTTP多线程下载原理

1、发送一个含有Rang头的Head请求,如果返回状态码为206,则允许多线程下载

 

原理二:多线程下载原理

1、使用HttpClient的Head请求获取请求文件的信息

2、发送一个Rang的Head请求判断是否允许多线程下载

3、通过主任务创建多个分段下载线程,分段下载文件,然后用Java的随机读写文件类保存下载的内容

 

等有时间了再添加内容吧,先简单写这么多

调度功能代码片段

Java代码
  1. /**  
  2.  * 开始下载  
  3.  * @throws Exception  
  4.  */  
  5. public void startDown() throws Exception{   
  6.     HttpClient httpClient = new DefaultHttpClient();   
  7.     try {   
  8.         //获取下载文件信息   
  9.         getDownloadFileInfo(httpClient);   
  10.         //启动多个下载线程   
  11.         startDownloadThread();   
  12.         //开始监视下载数据   
  13.         monitor();   
  14.     } catch (Exception e) {   
  15.         throw e;   
  16.     } finally {   
  17.         httpClient.getConnectionManager().shutdown();   
  18.     }   
  19. }   
  20.   
  21. /**  
  22.  * 获取下载文件信息  
  23.  */  
  24. private void getDownloadFileInfo(HttpClient httpClient) throws IOException,   
  25.         ClientProtocolException, Exception {   
  26.     HttpHead httpHead = new HttpHead(url);   
  27.     HttpResponse response = httpClient.execute(httpHead);   
  28.     //获取HTTP状态码   
  29.     int statusCode = response.getStatusLine().getStatusCode();   
  30.   
  31.     if(statusCode != 200throw new Exception("资源不存在!");   
  32.     if(getDebug()){   
  33.         for(Header header : response.getAllHeaders()){   
  34.             System.out.println(header.getName()+":"+header.getValue());   
  35.         }   
  36.     }   
  37.   
  38.     //Content-Length   
  39.     Header[] headers = response.getHeaders("Content-Length");   
  40.     if(headers.length > 0)   
  41.         contentLength = Long.valueOf(headers[0].getValue());   
  42.   
  43.     httpHead.abort();   
  44.        
  45.     httpHead = new HttpHead(url);   
  46.     httpHead.addHeader("Range""bytes=0-"+(contentLength-1));   
  47.     response = httpClient.execute(httpHead);   
  48.     if(response.getStatusLine().getStatusCode() == 206){   
  49.         acceptRanges = true;   
  50.     }   
  51.     httpHead.abort();   
  52. }   
  53.   
  54. /**  
  55.  * 启动多个下载线程  
  56.  * @throws IOException  
  57.  * @throws FileNotFoundException  
  58.  */  
  59. private void startDownloadThread() throws IOException,   
  60.         FileNotFoundException {   
  61.     //创建下载文件   
  62.     File file = new File(localPath);   
  63.     file.createNewFile();   
  64.     RandomAccessFile raf = new RandomAccessFile(file, "rw");   
  65.     raf.setLength(contentLength);   
  66.     raf.close();   
  67.        
  68.     //定义下载线程事件实现类   
  69.     DownloadThreadListener listener = new DownloadThreadListener() {   
  70.         public void afterPerDown(DownloadThreadEvent event) {   
  71.             //下载完一个片段后追加已下载字节数   
  72.             synchronized (object) {   
  73.                 DownloadTask.this.receivedCount += event.getCount();   
  74.             }   
  75.         }   
  76.   
  77.         public void downCompleted(DownloadThreadEvent event) {   
  78.             //下载线程执行完毕后从主任务中移除   
  79.             threads.remove(event.getTarget());   
  80.             if(getDebug()){   
  81.                 System.out.println("剩余线程数:"+threads.size());   
  82.             }   
  83.         }   
  84.     };   
  85.        
  86.     //不支持多线程下载时   
  87.     if (!acceptRanges) {   
  88.         if(getDebug()){   
  89.             System.out.println("该地址不支持多线程下载");   
  90.         }   
  91.         //定义普通下载   
  92.         DownloadThread thread = new DownloadThread(url, 0, contentLength, file, false);   
  93.         thread.addDownloadListener(listener);   
  94.         thread.start();   
  95.         threads.add(thread);   
  96.         return;   
  97.     }   
  98.        
  99.     //每个请求的大小   
  100.     long perThreadLength = contentLength / threadCount + 1;   
  101.     long startPosition = 0;   
  102.     long endPosition = perThreadLength;   
  103.     //循环创建多个下载线程   
  104.     do{   
  105.         if(endPosition >= contentLength)   
  106.             endPosition = contentLength - 1;   
  107.   
  108.         DownloadThread thread = new DownloadThread(url, startPosition, endPosition, file);   
  109.         thread.addDownloadListener(listener);   
  110.         thread.start();   
  111.         threads.add(thread);   
  112.   
  113.         startPosition = endPosition + 1;//此处加 1,从结束位置的下一个地方开始请求   
  114.         endPosition += perThreadLength;   
  115.     } while (startPosition < contentLength);   
  116. }  

 分段下载线程代码片段:

Java代码 复制代码  收藏代码
  1.   
  2. /**  
  3.  * 现在过程代码  
  4.  */  
  5. public void run() {   
  6.     if(DownloadTask.getDebug()){   
  7.         System.out.println("Start:" + startPosition + "-" +endPosition);   
  8.     }   
  9.     HttpClient httpClient = new DefaultHttpClient();   
  10.     try {   
  11.         HttpGet httpGet = new HttpGet(url);   
  12.         if(isRange){//多线程下载   
  13.             httpGet.addHeader("Range""bytes="+startPosition+"-"+endPosition);   
  14.         }   
  15.         HttpResponse response = httpClient.execute(httpGet);   
  16.         int statusCode = response.getStatusLine().getStatusCode();   
  17.         if(DownloadTask.getDebug()){   
  18.             for(Header header : response.getAllHeaders()){   
  19.                 System.out.println(header.getName()+":"+header.getValue());   
  20.             }   
  21.             System.out.println("statusCode:" + statusCode);   
  22.         }   
  23.         if(statusCode == 206 || (statusCode == 200 && !isRange)){   
  24.             InputStream inputStream = response.getEntity().getContent();   
  25.             //创建随机读写类   
  26.             RandomAccessFile outputStream = new RandomAccessFile(file, "rw");   
  27.             //跳到指定位置   
  28.             outputStream.seek(startPosition);   
  29.             int count = 0;byte[] buffer=new byte[1024];   
  30.             while((count = inputStream.read(buffer, 0, buffer.length))>0){   
  31.                 outputStream.write(buffer, 0, count);   
  32.                 //触发下载事件   
  33.                 fireAfterPerDown(new DownloadThreadEvent(this,count));   
  34.             }   
  35.             outputStream.close();   
  36.         }   
  37.         httpGet.abort();   
  38.     } catch (Exception e) {   
  39.         e.printStackTrace();   
  40.     } finally {   
  41.         //触发下载完成事件   
  42.         fireDownCompleted(new DownloadThreadEvent(this, endPosition));   
  43.         if(DownloadTask.getDebug()){   
  44.             System.out.println("End:" + startPosition + "-" +endPosition);   
  45.         }   
  46.         httpClient.getConnectionManager().shutdown();   
  47.     }   
  48. }  

 附件说明:

1、Download.jar为编译好的可运行程序

2、Download.zip为Eclipse项目文件

3、运行截图

 

 

 

相关文章
|
22天前
|
数据采集 Java API
Jsoup库能处理多线程下载吗?
Jsoup库能处理多线程下载吗?
|
4月前
|
数据采集 XML JavaScript
C# 中 ScrapySharp 的多线程下载策略
C# 中 ScrapySharp 的多线程下载策略
|
7月前
|
消息中间件 Java Kafka
实时计算 Flink版操作报错之Apache Flink中的SplitFetcher线程在读取数据时遇到了未预期的情况,该怎么解决
在使用实时计算Flink版过程中,可能会遇到各种错误,了解这些错误的原因及解决方法对于高效排错至关重要。针对具体问题,查看Flink的日志是关键,它们通常会提供更详细的错误信息和堆栈跟踪,有助于定位问题。此外,Flink社区文档和官方论坛也是寻求帮助的好去处。以下是一些常见的操作报错及其可能的原因与解决策略。
|
4月前
|
数据处理 Python
解锁Python多线程编程魔法,告别漫长等待!让数据下载如飞,感受科技带来的速度与激情!
【8月更文挑战第22天】Python以简洁的语法和强大的库支持在多个领域大放异彩。尽管存在全局解释器锁(GIL),Python仍提供多线程支持,尤其适用于I/O密集型任务。通过一个多线程下载数据的例子,展示了如何使用`threading`模块创建多线程程序,并与单线程版本进行了性能对比。实验表明,多线程能显著减少总等待时间,但在CPU密集型任务上GIL可能会限制其性能提升。此案例帮助理解Python多线程的优势及其适用场景。
48 0
|
7月前
|
数据采集 机器学习/深度学习 Java
数据猎手:使用Java和Apache HttpComponents库下载Facebook图像
本文介绍了如何使用Java和Apache HttpComponents库从Facebook获取图像数据。通过设置爬虫代理IP以避免限制,利用HttpClient发送请求,解析HTML找到图像链接,然后下载并保存图片。提供的Java代码示例展示了实现过程,包括创建代理配置、线程池,以及下载图片的逻辑。注意,实际应用需根据Facebook页面结构进行调整。
数据猎手:使用Java和Apache HttpComponents库下载Facebook图像
|
6月前
|
JSON 前端开发 API
Apache HttpClient调用Spring3 MVC Restful Web API演示
Apache HttpClient调用Spring3 MVC Restful Web API演示
54 1
|
7月前
|
Apache PHP Windows
apache下载
apache下载
55 1
|
7月前
|
JSON Java Apache
Spring Cloud Feign 使用Apache的HTTP Client替换Feign原生httpclient
Spring Cloud Feign 使用Apache的HTTP Client替换Feign原生httpclient
431 0
|
7月前
|
数据采集 前端开发 Java
利用Scala与Apache HttpClient实现网络音频流的抓取
利用Scala与Apache HttpClient实现网络音频流的抓取
|
前端开发 Java
【Java项目】SpringBoot项目的多文件兼多线程上传下载
【Java项目】SpringBoot项目的多文件兼多线程上传下载
418 0

推荐镜像

更多