2008年11月7日 星期五

Yahoo!奇摩 拍賣探勘程式 0.1.2 釋出

廢話不多說,簡單介紹一下改進功能:

1.[增加]模擬瀏覽器存取,自動產生 cookie 和追蹤連結,躲避 999 Error
2.[增加]加速下載時間和產生計時功能
3.[增加]提供中文搜尋
4.[增加]一般中文註解
5.[修正]字串過濾
6.[修正]Debug功能
7.[移除]Proxy功能

點選此下載

2008年9月11日 星期四

Yahoo 拍賣資料探勘程式 0.1

因為我懶得一頁一頁去點 Yahoo 拍賣,因此用 Python SGMLLib 語法剖析器實做 Yahoo 拍賣資料探勘,建議搭配 tor + privoxy 或是更改程式內 sleep 時間(約 90 ~ 120 秒),來迴避 999 error ,使用者請自取,更改 search 的參數可以調整標的物。如果不想用 proxy ,將 proxies=proxies ,含前面逗點拿掉。

點選此下載

2008年8月15日 星期五

立法院砍經費

立法院公報:資訊設備採購金額限制及學術網路管理規範依據

Page 37
8.資訊設備費:除95年度以前連續計畫已簽約者、立法院、消防署防救災
資訊系統、警政署及所屬、海岸巡防署及所屬、法務部、調查局外,其
餘統刪20%。

Page 39
三、新增通案附帶決議2項:
(一)針對全國各公務機關,年年編列鉅額資訊設備購置與汰換費用,經查,多
數僅供基本文書處理與上網之用,爰提案要求各公務機關自97年度起,新
購或汰換資訊設備時,個人桌上型電腦應以2萬5,000元、筆記型電腦應以
3萬元、雷射印表機應以2萬元為採購金額上限,且雷射印表機應以20人共
用一機為度,有特殊需求者,應於預算書中提出說明,交立法院審議。
(二)針對有關國家資通安全會報所頒訂「各政府機關(構)資訊安全責任等級
分級作業施行計畫」之內容,已將各級機關資安等級區分為A、B、C、D
四個等級,定義各類資安系統等級應執行之工作事項,然網路威脅不僅僅
只從外面侵入或系統的防護即可,組織內部同仁使用之個人電腦常在上網
的過程中,不知不覺中遭入侵,成為危害資訊安全的漏洞。政府部門如何
有效規範管理公務人員網際網路個人行為,特以此決議文之內容說明為基
礎,做為各機關(構)人員網路安全管理之依據,以維護各機關(構)電
腦資訊網路系統安全與使用者自身權益之相關事宜。
說明:
1.各機關(構)需制定員工上網行為管理使用準則,禁止員工於上班
時間瀏覽不當之網站(如暴力、色情、賭博、駭客、惡意網站、釣
魚詐欺、傀儡網路等)。
2.非禁止之不當網站,需建立稽核管理機制,以避免員工過度使用導
致內部頻寬擁塞及降低員工工作效率。
3.禁止員工使用網頁式電子郵件(WebMail),並建立管理機制,以
避免漏洞產生。
4.對於惡意行為的網站,需要有及時更新的機制,以避免員工在因空
窗期而感染必傳播惡意程式。
5.禁止於上班時間透過網路資源進行與工作內容無關之串流媒體、
MP3、圖片、檔案等網路上的傳輸。
6.非上班時間(中午休息、下班後)的使用,需建立稽核管理機制,
不得影響單位內主要系統運作之效率。
7.非經申請,禁止於上班時間使用即時訊息(Instant Message)、
點對點檔案共享(P2P)及tunnel相關工具。
8.經許可後使用之即時訊息及點對點檔案共享工具,需建立稽核管理
機制,以避免資安漏洞產生。
9.使用者不得於網際網路上下載及安裝非經許可之應用程式,以避免
資安上的風險(木馬,Tunnel軟體,間諜程式,傀儡程式等)及違
反法令之疑慮(著作權、版權)。
10.員工上網行為所佔之單位內部頻寬,需以不影響各主系統之網路
效能為前提,若有資源上的衝突,將以各主系統為主。
11.各機關(構)之機密文件,非經許可,不得透過網際網路工具(
IM、P2P、WebMail)來進行傳輸及檔案交換。
12.各機關(構)需建立稽核管理制度,以避免漏洞產生。
13.各機關(構)需確實掌握時效,於資安問題發生時,在最短時間
之內,彈性調整相關管理機制,以縮短資安空窗期。
14.行政院主計處應督促對於違反各機關(構)員工上網行為管理之
人員均應建立詳細的紀錄,以做為日後稽核查證之依據。

轉自
潛艦 | 立法院公報:資訊設備採購金額限制及學術網路管理規範依據

2008年3月22日 星期六

使用 Linux 簡易分析 win32 病毒的流程

這隻病毒是靠 MSN 到處流傳的,他會產生一張圖片和一隻 server.exe 的檔案

簡易的分析如下:

透過 wget 抓取該網站,他會導引出一隻 jpg.scr 類的螢幕保護程式。
jpg.scr 是一隻含有圖片、 server.exe 、 a.bat(包含在 zip 內部,解壓縮不會出現),
然後可以使用 strings 指令取得內部的一些字串,可以發現似乎是用 Delphi 寫成的。
用 wine 跑 dede 反組譯取得目標 server ip ,便可取得遠端目標。

再來要怎樣或是把遠端機器放入 NAT 黑名單也可以。

最近看到微軟有關學生的消息

1. Office 教育版特價,約兩千有找
2. Windows Server 2003 & 早期一些 VB VC 開發軟體免費供學生使用

補充:
微軟DreamSpark計劃提供學生免費開發軟體

2008年3月16日 星期日

nginx , 一個高速的 http service & rproxy & IMAP/POP3/SMTP proxy

最近幾天到處亂晃發現,據說可以負擔 apache 10 倍的連線數

他的官方網站是俄文的
http://sysoev.ru/

詳細介紹還是請參考社群的中文 wiki
http://wiki.codemongers.com/NginxChs

2008年3月6日 星期四

Spam & Mod_security

使用心得:

1. mod_security 內建正規表示法,消極面來看可以過濾不符合的資料,
像是 Spam 最常見的就是內含很多連結。
2. gotroot 有提供一些黑名單,該來源絕大部分都是從現有資料庫掃描。
3. 可以嵌入 perl script 或是 php code , 而不需要動到應用程式,只要更改規則。
4. 動態製造骯髒資訊給 bot ,讓其無法通過規則。
5. 透過一些外掛可以直接接觸到使用者,有問題可以即時在線上修改。

2008年3月5日 星期三

有關 zhpy 的套件包 (for Debian Sid)

可能已經有人知道了,一直忘記放上來,算是提醒。

http://twemu.no-ip.org/apt/zhpy/

補過 patch 跟 manpage ,有任何建議請告知本人。

中華電信台東區對外國連線發生錯誤


凌晨 2:32 - 2:44

traceroute to www.blogspot.com (72.14.223.191), 30 hops max, 40 byte packets
3 tt-c6r1.router.hinet.net (168.95.176.162) 28.521 ms 28.738 ms 29.412 ms
4 tt-c12r1.router.hinet.net (211.22.229.1) 33.394 ms 33.564 ms 33.985 ms
5 kh-c12r11.router.hinet.net (220.128.24.66) 35.654 ms 36.146 ms 36.527 ms
6 kh-c12r31.router.hinet.net (220.128.24.117) 40.148 ms 68.710 ms 18.678 ms
7 * * *
8 * * *

traceroute to www.msn.com (207.68.183.120), 30 hops max, 40 byte packets
3 tt-c6r1.router.hinet.net (168.95.176.162) 16.953 ms 17.577 ms 18.166 ms
4 tt-c12r2.router.hinet.net (211.22.229.14) 18.504 ms 18.672 ms 19.081 ms
5 kh-c12r12.router.hinet.net (220.128.25.66) 21.322 ms 21.497 ms 21.909 ms
6 tn-st-c12r12.router.hinet.net (220.128.25.29) 27.578 ms 19.992 ms 20.462 ms
7 ty-fo-c12r12.router.hinet.net (220.128.9.6) 26.900 ms 27.149 ms *
8 ty-fo-c12r31.router.hinet.net (211.21.116.27) 23.391 ms 23.913 ms 24.996 ms
9 * * *
10 * * *


還好有備用線路,連基本的服務都不正常,整個無言。

把一些比較和技術無關的切到另外的Blog

Nature with Notes


http://nature-with-notes.blogspot.com/

最近在整理的資料

  1. Python & Django 的應用
  2. Mod Security(Apache) 的規則
  3. Jserv 的演講錄影
  4. Wireless 和電信法規
  5. Mono 和 C# .Net Framework 在 Linux 下的環境建構
  6. 使用者介面和生理

2008年3月4日 星期二

最近比較安靜

陷入一種無力狀態

希望...

對於未知的事物不恐懼,對於已知的事物思來源

2008年2月4日 星期一

TWDebCamp 2007 & 台東大學自由軟體推廣活動 活動花絮

wiki.debian.org.tw 已經壞很久,希望年後能修好

TWDebCamp2007

有需要錄影的,請在此回文。

2008年1月12日 星期六

如何使用 NASM 來學習組合語言

如何使用 NASM 來學習組合語言

1. 為何不使用 MASM 來學習?

因為 MASM 不具備跨平台的特性,僅能在 Intel
機器上執行,而且有商業性使用限制,寫出來的程式碼除非有買微軟的軟體和微軟簽約才能發佈,對於使用者是一個負擔。網路上有眾多版本,越新的版本功能越多,但對新手使用也越不方便,所以為何要去惹這個麻煩。最後你不能研究或拿到它的原始碼,因為他不提供競爭對手任何改進空間,對於以後要深入深究編譯器和系統結構,又是一層問題,因此在使用上能避免使用的話盡量避免。

2. 我已經用了 MASM ,怎樣轉換?

它們一樣使用 Intel 的語法,所以照常使用就可以了。但是假指令跟 Macro 部份要請仔細閱讀使用手冊,因為多少有點出入。

3. 如何安裝?

到 http://sourceforge.net/project/showfiles.php?group_id=6208
下載你所要的版本。

(a) Windows 98/XP 要下載 nasm-2.00-win32.zip ,抓下來解壓縮到 c:\nasm
執行就可以了。

(b) Linux 下使用套件管理程式,並尋找 nasm 。

4. 如何使用?

(a) Linux 下開啟終端機然後直接執行 nasm 指令。

(b) Windows 下請到 (開始)->(執行) 並鍵入 cmd 來進入終端機,然後至 c:\nasm
目錄使用程式。(如果 cmd 不會用的話,請去查指令)

5. 如何編輯檔案?

使用 Notepad 或是其他純文字編輯軟體

6. 寫出第一個 Hello World

(a) Linux

將檔案存入 a.asm (程式碼部份)

SECTION .DATA

hello: db 'Hello world!',10

helloLen: equ $-hello

SECTION .TEXT

GLOBAL _start

_start:

; Write 'Hello world!' to the screen

mov eax,4 ; 'write' system call

mov ebx,1 ; file descriptor 1 = screen

mov ecx,hello ; string to write

mov edx,helloLen ; length of string to write

int 80h ; call the kernel

; Terminate program

mov eax,1 ; 'exit' system call

mov ebx,0 ; exit with error code 0

int 80h ; call the kernel

然後執行 nasm -f elf -o a.o a.asm && ld a.o ,

將 a 加上可執行屬性,然後執行 ./a

(b) Windows

將檔案存入 a.asm (程式碼部份)

org 0100H

jmp _start

hello db 'Hello world!',13,10,'$' ; end at $

_start:

; Write 'Hello world!' to the screen

mov ah,9 ; write code 9 for print

mov dx,hello ; string to write

int 21h ; call the kernel

; Terminate program

mov ah,04ch ; 'exit' system call

int 21h ; call the kernel

然後在 c:\nasm\ 目錄下執行 nasm.exe a.asm -o a.com ,

a.com 檔就是執行檔。

7. 如何 Debug ?

(a) Windows 下建議使用 SoftICE 或 Debug (VS 內建的也可)。

(b) Linux 下建議使用 Nemiver 或 GNU Debugger。

8. 題外話:如何更上一層樓?

官方說法是「有恆心有毅力,總有一天會成功」,個人說法是「當書堆到整間臥室都是之後,把垃圾全部扔掉剩下來的就是了」,不負責任說法是「當你想偷開正妹視訊都懶得開的時候」。

2008年1月6日 星期日

linux.tw 變成 童書榨汁機

看起來設定有點問題,剛好指到自己的商業性網站去。

其他的看起來蠻正常的。