前兩天看到有人求客戶端socket 發(fā)HTTP包的代碼,,受flw版主啟發(fā)找了一些perl的資料,不過對perl 還是不太熟悉,。也沒有深入的研究,。
無意中發(fā)現(xiàn)了libcurl.so 這個庫,。去google上搜索發(fā)現(xiàn)它是處理客戶端發(fā)送HTTP請求的庫 以及可以處理web服務器回送回來的包,。研究
了兩天將研究的成果,共享出來給大家一起研究,。
參考:http://curl./ 這是curl開發(fā)者的首頁,。
利用libcurl.so庫 我們能輕松的連接某個web站點。獲得某個首頁的html代碼 或者是http 請求的頭部,。 還可以提交表單,,
此外它還支持ftp,https,
/usr/include/curl/curl.h 中。
1 CURLcode curl_global_init(long flags);
描述:
這個函數(shù)只能用一次,。(其實在調用curl_global_cleanup 函數(shù)后仍然可再用)
如果這個函數(shù)在curl_easy_init函數(shù)調用時還沒調用,,它講由libcurl庫自動完成。
參數(shù):flags
CURL_GLOBAL_ALL //初始化所有的可能的調用,。
CURL_GLOBAL_SSL //初始化支持 安全套接字層,。
CURL_GLOBAL_WIN32 //初始化win32套接字庫。
CURL_GLOBAL_NOTHING //沒有額外的初始化,。
2 void curl_global_cleanup(void);
描述:在結束libcurl使用的時候,,用來對curl_global_init做的工作清理。類似于close的函數(shù),。
3 char *curl_version( );
描述: 打印當前l(fā)ibcurl庫的版本,。
4 CURL *curl_easy_init( );
描述:
curl_easy_init用來初始化一個CURL的指針(有些像返回FILE類型的指針一樣). 相應的在調用結束時要用curl_easy_cleanup函數(shù)清理.
一般curl_easy_init意味著一個會話的開始. 它的返回值一般都用在easy系列的函數(shù)中.
5 void curl_easy_cleanup(CURL *handle);
描述:
這個調用用來結束一個會話.與curl_easy_init配合著用.
參數(shù):
CURL類型的指針.
6 CURLcode curl_easy_setopt(CURL *handle, CURLoption option, parameter);
描述: 這個函數(shù)最重要了.幾乎所有的curl 程序都要頻繁的使用它.
它告訴curl庫.程序將有如何的行為. 比如要查看一個網(wǎng)頁的html代碼等.
(這個函數(shù)有些像ioctl函數(shù))
參數(shù):
1 CURL類型的指針
2 各種CURLoption類型的選項.(都在curl.h庫里有定義,man 也可以查看到)
3 parameter 這個參數(shù) 既可以是個函數(shù)的指針,也可以是某個對象的指針,也可以是個long型的變量.它用什么這取決于第二個參數(shù).
CURLoption 這個參數(shù)的取值很多.具體的可以查看man手冊.
7 CURLcode curl_easy_perform(CURL *handle);
描述:這個函數(shù)在初始化CURL類型的指針 以及curl_easy_setopt完成后調用. 就像字面的意思所說perform就像是個舞臺.讓我們設置的
option 運作起來.
參數(shù):
CURL類型的指針.
mq110 回復于:2005-07-31 09:43:58
下面來看一個簡單的例子:
用來獲得某個主頁的html代碼
#include <stdio.h>;
#include <curl/curl.h>;
#include <stdlib.h>;
int main(int argc, char *argv[])
{
CURL *curl; //定義CURL類型的指針
CURLcode res; //定義CURLcode類型的變量
if(argc!=2)
{
printf("Usage : file <url>;\n");
exit(1);
}
curl = curl_easy_init(); //初始化一個CURL類型的指針
if(curl!=NULL)
{
//設置curl選項. 其中CURLOPT_URL是讓用戶指定url. argv[1]中存放的命令行傳進來的網(wǎng)址
curl_easy_setopt(curl, CURLOPT_URL, argv[1]);
//調用curl_easy_perform 執(zhí)行我們的設置.并進行相關的操作. 在這里只在屏幕上顯示出來.
res = curl_easy_perform(curl);
//清除curl操作.
curl_easy_cleanup(curl);
}
return 0;
}
編譯: gcc -o 001 -Wall 001.c -lcurl
我們來獲得www. 主頁的html代碼
./001 www.
mq110 回復于:2005-07-31 09:44:51
再來看一個例子:
實際編程時 我們未必只顯示出來.我們的目的是要對獲得html代碼做相應的處理.比如檢驗關鍵字,發(fā)現(xiàn)重要信息等等.
那么我們就需要把獲得的html代碼存入相應的文件中.看下面一個例子
#include <stdio.h>;
#include <stdlib.h>;
#include <unistd.h>;
#include <curl/curl.h>;
#include <curl/types.h>;
#include <curl/easy.h>;
FILE *fp; //定義FILE類型指針
size_t write_data(void *ptr, size_t size, size_t nmemb, void *stream) //這個函數(shù)是為了符合CURLOPT_WRITEFUNCTION, 而構造的
{
int written = fwrite(ptr, size, nmemb, (FILE *)fp);
return written;
}
int main(int argc, char *argv[])
{
CURL *curl;
curl_global_init(CURL_GLOBAL_ALL);
curl=curl_easy_init();
curl_easy_setopt(curl, CURLOPT_URL, argv[1]);
if((fp=fopen(argv[1],"w"))==NULL)
{
curl_easy_cleanup(curl);
exit(1);
}
curl_easy_setopt(curl, CURLOPT_WRITEFUNCTION, write_data); //CURLOPT_WRITEFUNCTION 將后繼的動作交給write_data函數(shù)處理
curl_easy_perform(curl);
curl_easy_cleanup(curl);
exit(0);
}
gcc -o 002 -Wall 002.c -lcurl
./002 www.
這個例子就將html代碼保存在了www.文件中了.
mq110 回復于:2005-07-31 09:45:42
此外還可以獲得http報文的頭部 post表單 等等. 這里就不詳細的介紹了. 具體的可以man curl_easy_setopt
(要用到一個重要的結構體,HttpPost)
下面看一個從ftp站點下載文件的例子.
#include <stdio.h>;
#include <curl/curl.h>;
#include <curl/types.h>;
#include <curl/easy.h>;
struct FtpFile //定義一個結構為了傳遞給my_fwrite函數(shù).可用curl_easy_setopt的CURLOPT_WRITEDATA選項傳遞
{
char *filename;
FILE *stream;
};
int my_fwrite(void *buffer, size_t size, size_t nmemb, void *stream)
{
struct FtpFile *out=(struct FtpFile *)stream; // stream指針其實就是 指向struct FtpFile ftpfile的
if(out && !out->;stream)
{
out->;stream=fopen(out->;filename, "wb"); //沒有這個流的話就創(chuàng)建一個 名字是out->;filename.
if(!out->;stream)
return -1;
}
return fwrite(buffer, size, nmemb, out->;stream);
}
int main(int argc, char *argv[])
{
CURL *curl;
CURLcode res;
struct FtpFile ftpfile={argv[2],NULL}; //初始化一個FtpFile結構
curl_global_init(CURL_GLOBAL_DEFAULT);
curl = curl_easy_init();
if(curl)
{
curl_easy_setopt(curl, CURLOPT_URL,argv[1]);
curl_easy_setopt(curl, CURLOPT_WRITEFUNCTION, my_fwrite);
curl_easy_setopt(curl, CURLOPT_WRITEDATA, &ftpfile); //給相關函數(shù)的第四個參數(shù) 傳遞一個結構體的指針
curl_easy_setopt(curl, CURLOPT_VERBOSE, TRUE); //CURLOPT_VERBOSE 這個選項很常用 用來在屏幕上顯示對服務器相關操作返回的信息
res = curl_easy_perform(curl);
curl_easy_cleanup(curl);
if(CURLE_OK != res)
fprintf(stderr, "curl told us %d\n", res);
}
if(ftpfile.stream)
fclose(ftpfile.stream);
curl_global_cleanup();
return 0;
}
gcc -o 003 -Wall 003.c -lcurl
./003 ftp://202.96.64.144/fei.gif fei.gif
我有個匿名的ftp的網(wǎng)址 將目錄下的fei.gif 保存到本地 也叫fei.gif
此外還有curl_escape curl_unescape函數(shù)用來轉換 漢字成 %XX 這種類型.以及轉換回來.如果要下載帶有漢字的文件.先要調用將字符串轉換一下.
curl 庫 還有好多功能. 有待大家來挖掘. |