C++ LibCurl 库的使用方法

c++,libcurl,使用,方法 · 浏览次数 : 383

小编点评

#include #include #include using namespace std; #define CURL_STATICLIB #define BUILDING_LIBCURL #include <iostream>#include "curl/curl.h" #pragma comment (lib,\"libcurl_a.lib\") #pragma comment (lib,\"wldap32.lib\") #pragma comment (lib,\"ws2_32.lib\") #pragma comment (lib,\"Crypt32.lib\") // 获取数据并放入string中.std::string GetUrlPageOfString(std::string url){\tstd::string read_buffer;\tCURL *curl;\tcurl_global_init(CURL_GLOBAL_ALL);\tcurl = curl_easy_init();\if (curl)\t{\t\t// 忽略证书检查\t\tcurl_easy_setopt(curl, CURLOPT_SSL_VERIFYPEER, 0L);\t\t// 重定向\t\tcurl_easy_setopt(curl, CURLOPT_FOLLOWLOCATION, 1);\t\t// URL路径\t\tcurl_easy_setopt(curl, CURLOPT_URL, url);\t\t\t// 查找次数,防止查找太深\t\tcurl_easy_setopt(curl, CURLOPT_MAXREDIRS, 1);\t\t// 连接超时\t\tcurl_easy_setopt(curl, CURLOPT_CONNECTTIMEOUT, 3);\t\t// 接收数据时超时设置\t\tcurl_easy_setopt(curl, CURLOPT_TIMEOUT, 3);\t\t\t// 写入回调函数\t\tcurl_easy_setopt(curl, CURLOPT_WRITEFUNCTION, WriteCallback);\t\tcurl_easy_setopt(curl, CURLOPT_WRITEDATA, &read_buffer);\t\tcurl_easy_perform(curl);\t\tcurl_easy_cleanup(curl);\t\treturn read_buffer;\t}\treturn "None\";}int main(int argc, char *argv[]){\tstd::string urls = GetUrlPageOfString(\"https://www.lyshark.com\");\tstd::cout << \"接收长度: \" << urls.length() << \" bytes\" << std::endl;\tsystem("pause");\treturn 0;} // 获取数据并放入string中 std::string GetUrlPageOfString(std::string url){\tstd::string read_buffer;\tCURL *curl;\tcurl_global_init(CURL_GLOBAL_ALL);\tcurl = curl_easy_init();\if (curl)\t{\t\t// 忽略证书检查\t\tcurl_easy_setopt(curl, CURLOPT_SSL_VERIFYPEER, 0L);\t\t// 重定向\t\tcurl_easy_setopt(curl, CURLOPT_FOLLOWLOCATION, 1);\t\t// URL路径\t\tcurl_easy_setopt(curl, CURLOPT_URL, url);\t\t\t// 查找次数,防止查找太深\t\tcurl_easy_setopt(curl, CURLOPT_MAXREDIRS, 1);\t\t// 连接超时\t\tcurl_easy_setopt(curl, CURLOPT_CONNECTTIMEOUT, 3);\t\t// 接收数据时超时设置\t\tcurl_easy_setopt(curl, CURLOPT_TIMEOUT, 3);\t\t\t// 写入回调函数\t\tcurl_easy_setopt(curl, CURLOPT_WRITEFUNCTION, WriteCallback);\t\tcurl_easy_setopt(curl, CURLOPT_WRITEDATA, &read_buffer);\t\tcurl_easy_perform(curl);\t\tcurl_easy_cleanup(curl);\t\treturn read_buffer;\t}\treturn "None\";}int main(int argc, char *argv[]){\treturn 0;}

正文

LibCurl是一个开源的免费的多协议数据传输开源库,该框架具备跨平台性,开源免费,并提供了包括HTTPFTPSMTPPOP3等协议的功能,使用libcurl可以方便地进行网络数据传输操作,如发送HTTP请求、下载文件、发送电子邮件等。它被广泛应用于各种网络应用开发中,特别是涉及到数据传输的场景。

首先读者需要自行下载该库,如下笔者选择下载curl-8.0.1.zip这个源代码版本,读者可找到如下页面,并点击对应版本完成下载,当下载好以后读者可自行将其解压缩到任意目录下。

当读者解压缩后,可打开VS2013 开发人员命令提示并切换带该目录中的curl-8.0.1\winbuild目录,通过执行如下两条命令即可分别实现编译静态库或动态库,我们以静态库编译为主,执行如下命令读者可自行等待一段时间。

  • 动态库: nmake /f Makefile.vc mode=dll VC=13 MACHINE=x86 DEBUG=no
  • 静态库: nmake / f Makefile.vc mode = static VC = 13 ENABLE_IDN = no MACHINE = x86 DEBUG = no

这个库在编译通过后会自动生成文件到builds\libcurl-vc13-x86-release-static-ipv6-sspi-schannel目录内,读者可自行打开该目录,即可看到该目录内的头文件以及库目录文件,如下图所示;

读者可自行配置这个静态库,通常只需要配置includelib文件即可,该库的使用很简单,首先我们需要调用curl_easy_init()函数对CURL对象进行初始化,接着通过调用curl_easy_setopt()并传入一个访问URL链接,当访问成功后则可调用curl_easy_perform()函数得到访问结果,这就是该库基本使用方法,如下代码。

#define CURL_STATICLIB
#define BUILDING_LIBCURL
#include <iostream>
#include "curl/curl.h"

#pragma comment (lib,"libcurl_a.lib")
#pragma comment (lib,"wldap32.lib")
#pragma comment (lib,"ws2_32.lib")
#pragma comment (lib,"Crypt32.lib")

using namespace std;

int main(int argc, char *argv[])
{
	CURL *curl;
	CURLcode res;
	curl = curl_easy_init();
	if (curl)
	{
		curl_easy_setopt(curl, CURLOPT_URL, "https://www.lyshark.com");
		res = curl_easy_perform(curl);
		curl_easy_cleanup(curl);
	}

	std::cout << "返回状态: " << res << std::endl;

	system("pause");
	return 0;
}

运行上述代码,读者可看到网站www.lyshark.com的源代码,如下图所示;

上述代码中的curl_easy_setopt()函数第二个参数可以使用多种类型的变量定义,我们可以通过传入不同的常量来定义请求头中的参数,例如当我们需要修改协议头时,可以使用CURLOPT_HTTPHEADER常量,并在其后第三个参数中传入该常量所对应的结构即可,这个结构体定义有许多类型,具体如下下表所示;

常量名称 描述
CURLINFO_EFFECTIVE_URL 最后一个有效的URL地址
CURLINFO_HTTP_CODE 最后一个收到的HTTP代码
CURLINFO_FILETIME 远程获取文档的时间,如果无法获取,则返回值为-1
CURLINFO_TOTAL_TIME 最后一次传输所消耗的时间
CURLINFO_NAMELOOKUP_TIME 名称解析所消耗的时间
CURLINFO_CONNECT_TIME 建立连接所消耗的时间
CURLINFO_PRETRANSFER_TIME 从建立连接到准备传输所使用的时间
CURLINFO_STARTTRANSFER_TIME 从建立连接到传输开始所使用的时间
CURLINFO_REDIRECT_TIME 在事务传输开始前重定向所使用的时间
CURLINFO_SIZE_UPLOAD 以字节为单位返回上传数据量的总值
CURLINFO_SIZE_DOWNLOAD 以字节为单位返回下载数据量的总值
CURLINFO_SPEED_DOWNLOAD 平均下载速度
CURLINFO_SPEED_UPLOAD 平均上传速度
CURLINFO_HEADER_SIZE header部分的大小
CURLINFO_HEADER_OUT 发送请求的字符串
CURLINFO_REQUEST_SIZE 在HTTP请求中有问题的请求的大小
CURLINFO_SSL_VERIFYRESULT 通过设置CURLOPT_SSL_VERIFYPEER返回的SSL证书验证请求的结果
CURLINFO_CONTENT_LENGTH_DOWNLOAD 从Content-Length: field中读取的下载内容长度
CURLINFO_CONTENT_LENGTH_UPLOAD 上传内容大小的说明
CURLINFO_CONTENT_TYPE 下载内容的Content-Type:值,NULL表示服务器没有发送有效的Content-Type:header

如下案例是一个简单的GET请求封装,通过调用GetStatus()函数实现对特定页面发起请求的功能,其中curl_slist_append()用于增加新的请求头数据,在调用curl_easy_setopt()函数时,分别传入了CURLOPT_HTTPHEADER设置请求头,CURLOPT_WRITEFUNCTION设置回调,CURLINFO_PRIMARY_IP获取目标IP地址,CURLINFO_RESPONSE_CODE获取目标返回代码,此处的write_data()函数直接返回0则表示屏蔽所有的页面输出内容。

#define CURL_STATICLIB
#define BUILDING_LIBCURL
#include <iostream>
#include "curl/curl.h"

#pragma comment (lib,"libcurl_a.lib")
#pragma comment (lib,"wldap32.lib")
#pragma comment (lib,"ws2_32.lib")
#pragma comment (lib,"Crypt32.lib")

using namespace std;

// 设置CURLOPT_WRITEFUNCTION回调函数,返回为空屏蔽输出
static size_t write_data(char *d, size_t n, size_t l, void *p)
{
	return 0;
}

// 获取网站返回值
void GetStatus(char *UrlPage)
{
	CURLcode return_code;

	// 初始化模块
	return_code = curl_global_init(CURL_GLOBAL_WIN32);
	if (CURLE_OK != return_code)
	{
		return;
	}

	// 初始化填充请求头
	struct curl_slist *headers = NULL;
	headers = curl_slist_append(headers, "User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:76.0)");
	headers = curl_slist_append(headers, "Referer: https://www.lyshark.com");

	// 初始化请求库
	CURL *easy_handle = curl_easy_init();
	if (NULL != easy_handle)
	{
		// CURLOPT_HTTPHEADER 自定义设置请求头
		curl_easy_setopt(easy_handle, CURLOPT_HTTPHEADER, headers);

		// CURLOPT_URL 自定义请求的网站
		curl_easy_setopt(easy_handle, CURLOPT_URL, UrlPage);

		// CURLOPT_WRITEFUNCTION 设置回调函数,屏蔽输出
		curl_easy_setopt(easy_handle, CURLOPT_WRITEFUNCTION, write_data);

		// 执行CURL访问网站
		return_code = curl_easy_perform(easy_handle);

		char *ipAddress = { 0 };

		// CURLINFO_PRIMARY_IP 获取目标IP信息
		return_code = curl_easy_getinfo(easy_handle, CURLINFO_PRIMARY_IP, &ipAddress);
		if ((CURLE_OK == return_code) && ipAddress)
		{
			std::cout << "目标IP: " << ipAddress << std::endl;
		}

		long retcode = 0;

		// CURLINFO_RESPONSE_CODE 获取目标返回状态
		return_code = curl_easy_getinfo(easy_handle, CURLINFO_RESPONSE_CODE, &retcode);
		if ((CURLE_OK == return_code) && retcode)
		{
			std::cout << "返回状态码: " << retcode << std::endl;
		}
	}
	curl_easy_cleanup(easy_handle);
	curl_global_cleanup();
}

int main(int argc, char *argv[])
{
	GetStatus("https://www.lyshark.com");
	system("pause");
	return 0;
}

运行上述代码,则可以获取到www.lyshark.com目标主机的IP地址以及页面返回状态,如下图所示;

当然该库同样支持POST请求方式,在使用POST请求时我们可以通过CURLOPT_COOKIEFILE参数指定Cookie参数,通过CURLOPT_POSTFIELDS指定POST的数据集,而如果需要使用代理模式则可以通过CURLOPT_PROXY方式来指定代理地址,

#define CURL_STATICLIB
#define BUILDING_LIBCURL
#include <iostream>
#include "curl/curl.h"

#pragma comment (lib,"libcurl_a.lib")
#pragma comment (lib,"wldap32.lib")
#pragma comment (lib,"ws2_32.lib")
#pragma comment (lib,"Crypt32.lib")

using namespace std;

bool SendPost(char *Url, char *Cookie, char *PostVal)
{
	CURL *curl;
	CURLcode res;

	// 初始化库
	curl = curl_easy_init();
	if (curl)
	{
		// 设置请求头
		struct curl_slist *headers = NULL;
		headers = curl_slist_append(headers, "User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:76.0)");
		headers = curl_slist_append(headers, "Referer: https://www.lyshark.com");

		// 设置请求头
		curl_easy_setopt(curl, CURLOPT_HTTPHEADER, headers);

		// 指定URL
		curl_easy_setopt(curl, CURLOPT_URL, Url);

		// 指定cookie参数
		curl_easy_setopt(curl, CURLOPT_COOKIEFILE, Cookie);

		// 指定post内容
		curl_easy_setopt(curl, CURLOPT_POSTFIELDS, PostVal);

		// 是否代理
		// curl_easy_setopt(curl, CURLOPT_PROXY, "10.99.60.201:8080");
		res = curl_easy_perform(curl);
		curl_easy_cleanup(curl);
	}
	return true;
}

int main(int argc, char *argv[])
{
	// 传入网址 cookie 以及post参数
	SendPost("https://www.lyshark.com/post.php", "1e12sde342r2", "&logintype=uid&u=xieyan&psw=xxx86");

	system("pause");
	return 0;
}

该函数的调用需要有一个POST结构才可测试,此处由于我并没有指定接口所有返回了页面错误信息,如下图所示;

接着继续实现下载页面到本地的功能,该功能实现的原理是利用write_data回调函数,当页面数据被读入到内存时回调函数会被触发,在该回调函数的内部通过调用fwrite函数将ptr指针中的数据保存本地,实现这段代码如下所示;

#define CURL_STATICLIB
#define BUILDING_LIBCURL
#include <iostream>
#include "curl/curl.h"

#pragma comment (lib,"libcurl_a.lib")
#pragma comment (lib,"wldap32.lib")
#pragma comment (lib,"ws2_32.lib")
#pragma comment (lib,"Crypt32.lib")

using namespace std;

FILE *fp;

size_t write_data(void *ptr, size_t size, size_t nmemb, void *stream)
{
	int written = fwrite(ptr, size, nmemb, (FILE *)fp);
	return written;
}

BOOL GetUrl(char *URL, char *FileName)
{
	CURL *curl;

	curl_global_init(CURL_GLOBAL_ALL);
	curl = curl_easy_init();

	curl_easy_setopt(curl, CURLOPT_URL, URL);

	// 在屏幕打印请求连接过程和返回http数据
	curl_easy_setopt(curl, CURLOPT_VERBOSE, 1L);

	// 查找次数,防止查找太深
	curl_easy_setopt(curl, CURLOPT_MAXREDIRS, 1);

	// 设置连接超时
	curl_easy_setopt(curl, CURLOPT_CONNECTTIMEOUT, 3);

	// 接收数据时超时设置
	curl_easy_setopt(curl, CURLOPT_TIMEOUT, 3);

	if ((fp = fopen(FileName, "w")) == NULL)
	{
		curl_easy_cleanup(curl);
		return FALSE;
	}
	// CURLOPT_WRITEFUNCTION 将后继的动作交给write_data函数处理
	curl_easy_setopt(curl, CURLOPT_WRITEFUNCTION, write_data);

	curl_easy_perform(curl);
	curl_easy_cleanup(curl);
	return TRUE;
}

int main(int argc, char *argv[])
{
	// 下载网页到本地
	GetUrl("https://www.lyshark.com", "./lyshark.html");

	system("pause");
	return 0;
}

当读者运行上述程序后,即可将www.lyshark.com网站页面源码,下载到本地当前目录下lyshark.html,输出效果如下图所示;

为了能解析参数,我们还是需要将页面源代码读入到内存中,要实现这个需求并不难,首先我们定义一个std::string容器,然后当有新数据产生时触发WriteCallback在该函数内,我们直接将数据拷贝到一个内存指针中,也就是存储到read_buffer内,并将该缓冲区返回给调用者即可,如下则是完整源代码。

#define CURL_STATICLIB
#define BUILDING_LIBCURL
#include <iostream>
#include <string>
#include "curl/curl.h"

#pragma comment (lib,"libcurl_a.lib")
#pragma comment (lib,"wldap32.lib")
#pragma comment (lib,"ws2_32.lib")
#pragma comment (lib,"Crypt32.lib")

using namespace std;

// 存储回调函数
size_t WriteCallback(char *contents, size_t size, size_t nmemb, void *userp)
{
	((std::string*)userp)->append((char*)contents, size * nmemb);
	return size * nmemb;
}

// 获取数据并放入string中.
std::string GetUrlPageOfString(std::string url)
{
	std::string read_buffer;
	CURL *curl;

	curl_global_init(CURL_GLOBAL_ALL);
	curl = curl_easy_init();
	if (curl)
	{
		// 忽略证书检查
		curl_easy_setopt(curl, CURLOPT_SSL_VERIFYPEER, 0L);

		// 重定向
		curl_easy_setopt(curl, CURLOPT_FOLLOWLOCATION, 1);

		// URL路径
		curl_easy_setopt(curl, CURLOPT_URL, url);

		// 查找次数,防止查找太深
		curl_easy_setopt(curl, CURLOPT_MAXREDIRS, 1);

		// 连接超时
		curl_easy_setopt(curl, CURLOPT_CONNECTTIMEOUT, 3);

		// 接收数据时超时设置
		curl_easy_setopt(curl, CURLOPT_TIMEOUT, 3);

		// 写入回调函数
		curl_easy_setopt(curl, CURLOPT_WRITEFUNCTION, WriteCallback);
		curl_easy_setopt(curl, CURLOPT_WRITEDATA, &read_buffer);

		curl_easy_perform(curl);
		curl_easy_cleanup(curl);

		return read_buffer;
	}
	return "None";
}

int main(int argc, char *argv[])
{
	std::string urls = GetUrlPageOfString("https://www.lyshark.com");
	std::cout << "接收长度: " << urls.length() << " bytes" << std::endl;

	system("pause");
	return 0;
}

如下图所示,则是运行后输出内存数据长度,当然我们也可以直接输出urls中的数据,也就是网页的源代码;

本文作者: 王瑞
本文链接: https://www.lyshark.com/post/6aa9753b.html
版权声明: 本博客所有文章除特别声明外,均采用 BY-NC-SA 许可协议。转载请注明出处!

与C++ LibCurl 库的使用方法相似的内容:

C++ LibCurl 库的使用方法

LibCurl是一个开源的免费的多协议数据传输开源库,该框架具备跨平台性,开源免费,并提供了包括`HTTP`、`FTP`、`SMTP`、`POP3`等协议的功能,使用`libcurl`可以方便地进行网络数据传输操作,如发送`HTTP`请求、下载文件、发送电子邮件等。它被广泛应用于各种网络应用开发中,特别是涉及到数据传输的场景。

C# 开发技巧 轻松监控方法执行耗时

前言 MethodTimer.Fody 是一个功能强大的库,可以用于测量 .NET 应用程序中的方法的执行时间。允许你在不修改代码的情况下,自动地测量和记录方法的执行时间。 这个工具是基于.NET的 weaving 技术,通过修改IL(Intermediate Language,中间语言)代码来插入

C#开源、简单易用的Dapper扩展类库 - Dommel

前言 今天大姚给大家分享一个C#开源(MIT License)、免费、简单易用的Dapper扩展类库,帮助.NET开发者使用Dapper的CRUD操作变得更简单:Dommel。 项目特性 Dommel 使用 IDbConnection 接口上的扩展方法为 CRUD 操作提供了便捷的 API。 Dom

C语言指针易混淆知识点总结

指针 定义 指针是一个变量,存储另一个变量的内存地址,它允许直接访问和操作内存中的数据,使得程序能够以更灵活和高效的方式处理数据和内存。 获取变量地址:使用取地址符 &。 访问地址上的数据:使用解引用符 *。 例子1 指针是存储另一个变量地址的变量。通过使用取地址符 & 和解引用符 *,我们可以灵活

C++如何在main函数开始之前(或结束之后)执行一段逻辑?

1. 问题 2. 考察的要点 3. 解决策略 3.1. 方案一:使用GCC的拓展功能 3.2. 方案二:使用全局变量 3.3. 方案三:atexit 4. Demo测试 4.1. 测试代码 4.2. 执行结果 5. 程序异常退出场景 5.1. 存在的问题 5.2. 解决方案 5.2.1. 原理 5.

C#/.NET这些实用的编程技巧你都会了吗?

DotNet Exercises介绍 DotNetGuide专栏C#/.NET/.NET Core编程常用语法、算法、技巧、中间件、类库练习集,配套详细的文章教程讲解,助你快速掌握C#/.NET/.NET Core各种编程常用语法、算法、技巧、中间件、类库等等。 GitHub开源地址:https:/

C# 使用模式匹配的好处,因为好用所以推荐~

类型检查和转换:当你需要检查对象是否为特定类型,并且希望在同一时间内将其转换为那个类型时,模式匹配提供了一种更简洁的方式来完成这一任务,避免了使用传统的as和is操作符后还需要进行额外的null检查。 复杂条件逻辑:在处理复杂的条件逻辑时,特别是涉及到多个条件和类型的情况下,使用模式匹配可以使代码更

【C++】使用ort推理yolov10

【C++】使用ort推理yolov10 前言:由于笔者是编导专业,想玩玩yolo模型,搜来搜去全是python,所以在学会之后写一篇文章帮助和笔者同样情况的人 环境 Windows 10 C++17 onnxruntime18.1(DML版本) opencv4.9 visual studio2022

C++使用gnuplot-cpp库绘制图像

最近想要对一些时变的变量进行可视化,搜索来搜索去选择了使用gnuplot这个工具。 sudo apt-get install gnuplot sudo apt-get install gnuplot-x11 # 使其支持linux终端 这样就安装完gnuplot了。接着可以在命令行中键入gnuplo

C++11标准库梳理

shared_future、async、packaged_task、promise、future、atomic、CAS、condition_variable、condition_variable_any、unique_lock、recursive_timed_mutex、this_thread、ha...