分类目录归档:开源,标准
apache 源码剖析之 content handlers
1 handle 概述 2 hanle 处理流程 ap_invoke_handler(r); 1 handle 数据结构 2 责任函数 AP_IMPLEMENT_HOOK_RUN_FIRST(int, handler, (request_rec *r), (r), DECLINED) AP_IMPLEMENT_HOOK_RUN_FIRST(int, quick_handler, (request_rec *r, int lookup), (r, lookup), DECLINED) 3 示例: proxy_handle ap_hook_handler(proxy_handler, NULL, NULL, APR_HOOK_FIRST); ap_run_handle proxy_detect(request_rec *r) proxy_run_scheme_handler(r, worker, conf, … 继续阅读
打造一个开源的博客管理器
想把 博客园 的文章搬过来。没有找到合适的免费工具。于是 diy一个。 分析一下,需要的技术,一是 http protrol,二是 html/xml parse。http protrol协议同时需要支持 汉字 url,ssl,cookies,。html不是格式良好的 xml 文档,出于容错的考虑,使用 sax而不用 dom。同时,html parse 也需要支持编码集的转换。utf-8,unicode,gb2312。除此之外,我还想使文章照原来的日期显示。这可能需要用到 mysql的接口。 以前做过一个类似的项目,使用的是 gsoap toolkit。使用时发现的主要问题有: 对汉字标签处理有问题,不能处理格式不符合w3c规范的 html(比如 <br /> 可以被识别,而 <br>会被认为错误)。 从网上找找相关的文章。这次找了下面的套件: html/xml parse 使用 expat。这玩意是 firefox 用的。使用注册机制来处理结点。想必对格式并不良好的 html有较好的支持。 字符集转换,使用 apache 的 apr-iconv。 … 继续阅读