■スレッドリストへ戻る■ 全部 1- 101- 201- 301- 401- 501- 601- 701- 801- 901- 1001- 最新50

monazilla

779 :デフォルトの名無しさん :2001/06/28(木) 14:32
subject.txtの形式は、
takoが','区切り、他は<>区切りです。
ただし現在<>区切りの鯖でも倉庫のログが','区切りになっている
場合があります。
<>区切りの場合、<>の後に1つ空白が入ることがあります。
最後につくレス数は、
<レス数>
(レス数)(←全角)
(レス数)
のいずれかです。<>区切りであっても<レス数>とは限りません。
レス数の前に、空白が沢山付いている場合が多々あります。

','区切りの場合は、全て&ampを一文字の&に要変換。
さらに、'@'+'`'を','に変換します。
<>区切りではどちらの変換も行いませんが、古いログでは&amp→&
の変換が必要な場合があります。とりあえず
・&ampは&に変換
・ただし&amp;はそのまま
とすることをお勧めします。これは倉庫のhtml化スクリプトと互換です。

デリミタは、teri系が<>区切りで、最後の<>の後に空白が一つ、
他は','区切りで最後の空白なし。
また、メール欄が空白の時は区切り文字が連続しますが、
','区切りのログでは何か文字が入っていると、余分に空白が一つ付いて
いた時期があるようです。 <>区切りのログでは余分な空白は付きません。

タイトルの長さは、最近のサーバーならSETTING.TXTのBBS_SUBJECT_COUNT
で規定される制限があり、空(長さ0)のタイトル不可のようですが、
takoははるかに長いタイトルが可能で、タイトルが空のスレもあります。
また、www.2ch.netにあったスレが残っているような板も
長いタイトルがある可能性があります。

あぼーんされた行は
<>区切り あぼーん<>あぼーん<>あぼーん<>あぼーん<>あぼーん
tako   あぼーん,あぼーん,あぼーん,あぼーん
その他  あぼーん,あぼーん,あぼーん,あぼーん,
となり、スレの1だった場合、タイトルが空白(<>区切りではあぼーん)に
なります(takoは、デリミタが足りなくなるので要注意)。
また、板の復帰後はsubject.txt内のタイトルも空白になります。

稀にdat内に'\0'が入っている場合があるので要注意です。
書きこみ内容に'\0'が含まれると、そのままdatに入ってしまうようです。
http://teri.2ch.net/accuse/dat/972022159.dat
長いですが、211と213に'\0'があり、さらに文章が続いています。

また、文字化けの場合も少々注意が必要です。
(最近は直ったらしいのですが、以前名前欄に「初級」等と入れると
見事に化けていました)
単に化けるだけならそのままで良いのですが、化けた後の最後の文字が
SJISの1バイト目になります。
なので、無視して<B>名無しさん</B>のつもりでHTMLにすると、
<B>ヘ・猿"・/B>等とります。
http://mentai.2ch.net/os/dat/977070641.dat
(http://mentai.2ch.net/test/read.cgi?bbs=os&key=977070641&to=5)

その他、例外としては、
http://piza.2ch.net/tech/dat/974514695.dat
(http://piza.2ch.net/test/read.cgi?bbs=tech&key=974514695&to=5)
の2なんてのもありますが、
こんなのが幾つもあるとは思えないので、エラー扱いでいいかも。

317KB
新着レスの表示

スレッドリストへ戻る 全部 前100 次100 最新50

0ch BBS 2004-10-30