■スレッドリストへ戻る■ 全部 1- 101- 201- 301- 401- 501- 601- 最新50

read.cgi改良スレッド 3

1 :デフォルトの名無しさん :01/10/12 02:21
ここは read.cgi の改良だけを専門に扱うスレッドです。

2ちゃんねるで行われている他のプログラム開発や、動作報告・障害報告等に
ついては、それぞれ専用のスレッドが
http://piza2.2ch.net/test/read.cgi/tech/998908559/l20
に一覧されておりますので、移動してください。お願いします。

●前スレ
 http://piza2.2ch.net/test/read.cgi/tech/1000035521/l50

●read.cgi最新ソースコード(定期的に同期されています)
 http://www.gedoh.org/aki/2ch/current/bbs/

●2ちゃんねる軽量化関連スレッド群
 http://piza2.2ch.net/test/read.cgi/tech/998908559/l20

2 :デフォルトの名無しさん :01/10/12 02:35
駄スレ、うざい。

3 :デフォルトの名無しさん :01/10/12 03:28
全鯖Ver5.25に移行したのかな?

前スレの検討事項(最後の方にあった分だけ)
http://piza2.2ch.net/test/read.cgi/tech/1000035521/882
http://piza2.2ch.net/test/read.cgi/tech/1000035521/891

4 :デフォルトの名無しさん :01/10/12 04:12
5.24から5.25への変更点(ChangeLogから抜粋)

out_simplehtml()でHEADER_0を出していなかった
can_simplehtml()でREFERERが旧形式の時にbbsを取りそこなっていた
datファイルが見つからないときはLastModifiedを出さないように修正
AUTO_KAKO, AUTO_KAKO_MODE追加(過去ログの透過的閲覧)
PATH形式が多少くずれていても見えるようにした( '/'の個数 )
index.htmに戻らないようにした
携帯自動判別
1001レス以上を読めないようにした

などなど。

5 :デフォルトの名無しさん :01/10/13 03:34
しかし
  mod_gzip_item_include mime "text/.*"
で.datが圧縮されなかったというのは不思議だな オレのところでテストしてる限りは
ちゃんと圧縮かかるんだけど......ModuleListの順番がおかしいとMIMEタイプを
ちゃんと判定できないとか?

6 :デフォルトの名無しさん :01/10/13 22:41
タイトルの文字化け攻撃がまた可能になってるみたいです。
CUT_TAIL_BLANKがバグってませんか?
http://www2.bbspink.com/test/read.cgi/kitchen/997794049/l50

7 :デフォルトの名無しさん :01/10/13 23:43
>>6
ttp://www2.bbspink.com/kitchen/dat/997794049.dat
タイトルの「暴言スレ」+ \n の部分が
96 5c 8c be 83 58 83 8c e0 0a
ってなってる。
e0 が余分だけど、元々入ってたものなら、read.cgiでは対処なし?

8 :デフォルトの名無しさん :01/10/13 23:50
>>7
メール欄に関しては空白を挿入しているから
タイトルについても同様の対処をすべきではないかと。
というか前回この問題が話されたときはすでに
大丈夫…という結論になってたはずだけど
大丈夫じゃなかったみたい。
http://piza2.2ch.net/test/read.cgi/tech/1000035521/741-743

9 :デフォルトの名無しさん :01/10/13 23:59
>>8
E0はSJIS1と判定していないので、何もやってないみたい。
意図どおりには動いているようだが、IEなんかでE0が実際に単独で
表示されるとおかしくなる?

10 :デフォルトの名無しさん :01/10/14 00:01
>>9
おかしくなる。具体例が>>6のスレ。

11 :デフォルトの名無しさん :01/10/14 00:01
E0もSJISと判定するようにしたけど、いいでしょ?

12 :デフォルトの名無しさん :01/10/14 00:03
試しにE0を___23_にしてみたらちゃんと見えた。

13 :デフォルトの名無しさん :01/10/14 00:04
ということはFD〜FFとかもアヤシイのかな?
試してみるか。

14 :デフォルトの名無しさん :01/10/14 00:16
<title>の末尾にSJIS1判定に隣接した部分、80, FD, FE, FFを書いて
試してみたけど、大丈夫だった。(IE5.5SP2)
E0だけがまずかった感じ?

15 :デフォルトの名無しさん :01/10/14 00:19
じゃあE0をSJIS1判定に加える、で確定?

16 :デフォルトの名無しさん :01/10/14 17:28
他のブラウザ(エンジン)はどうかな。
Netscape, geckoとか。

手元でw3m(0.1.11-pre)を試してみたけど、これはe0も大丈夫だった。

17 :デフォルトの名無しさん :01/10/15 13:53
geturltaillenでのURL終端判定に > と < を追加した。
http://teri.2ch.net/test/read.cgi/accuse/994071363/681 で言われたので。

> http://ebi.2ch.net/test/read.cgi/php/996105815/108-

18 :デフォルトの名無しさん :01/10/15 13:54
>>17
おっと。
&gt;と&lt;ね。

19 :デフォルトの名無しさん :01/10/16 00:24
>>3 についてはどうしましょうか。
下の方(datのサイズ表示)は、いらないかと思うのですが。
どうしても知りたければ
ttp://piza2.2ch.net/test/read.cgi/tech/1000035521/1?raw=0.0
これで Range:0-940/345274 ← ここを見てもらう。

20 :デフォルトの名無しさん :01/10/16 01:34
>>19
うーん、Rengeって、・・・
ブラウザからはだめですね
ま、いっか

21 :デフォルトの名無しさん :01/10/16 01:38
ちゃんとブラウザから見られるよ。
トンチンカンなこと言ってる暇があったらクリックしてみろ。

22 :デフォルトの名無しさん :01/10/16 01:53
>>19
つーかなんでh削ってんのよ

23 :デフォルトの名無しさん :01/10/16 10:04
このスレのタイトルと1が正しく表示できません。
ホットゾヌだとなぜか正しく表示したりして。
http://piza2.2ch.net/test/read.cgi/mona/997113569/l50

24 :デフォルトの名無しさん :01/10/16 15:39
saladの過去ログ倉庫対応(.gzも探す)はもう入ってましたっけ?

25 :デフォルトの名無しさん :01/10/16 17:26
>>23
ホットゾヌでも本文は正しくないね。
本文中にURLへの<a href>が含まれてしまってる。

read.cgiのほうでは、>>数字形式以外の<a href>があると
そこからを次のフィールドと見なしてしまうバグがあった。
1の本文にあったため、次のフィールドであるスレタイトルが
そこから始まったことになってしまった形ですね。

その上、そこから区切りまでがzz_titleのサイズ 256バイトよりも
大きかったため、<a>タグ文の途中で切れてしまい、後ろがぼろぼろに
なっていたと。

ということで
本文中に<a href>があり、そのテキストがhttp:で始まっていた場合は
</a>までをそのままコピーするようにし、
また処理できない場合は単なる文字列としてそのまま書き出して
続行するようにしてみた。

26 :デフォルトの名無しさん :01/10/16 17:36
>>24
rawモードで-ERRのときに限り探してるみたい

27 :デフォルトの名無しさん :01/10/16 18:10
>>26
こういう誤解を招くんでrawモード以外でも
チェックしたほうがいいと思われ
http://teri.2ch.net/test/read.cgi/accuse/988761989/902

28 :デフォルトの名無しさん :01/10/16 20:37
キーの後ろにスラッシュがついていないURLが来たとき、
BASEを吐いてそのまま返すとキャッシュが効かないので
Location: を返すようにできませんか?

29 :デフォルトの名無しさん :01/10/16 20:42
>>28
理想的には全部Locationにしたいけど、それをやると莫大な数の
redirect転送が発生しそうで、果たしてどれだけキャッシュによって
削減できるのかが気になるところ…

過去ログ相手ならいいだろうけど。

30 :デフォルトの名無しさん :01/10/16 20:44
>>29
・IEの履歴のバグや手動で削った場合に発生しやすい
・スレのキーのみのURLは「全レス」であり、巨大になりがち

という理由から、全レスの場合のみLocationにするのが
いいのではないかと。
IEの履歴からたどったということはキャッシュにヒットする
確率も高いでしょうし。

31 :デフォルトの名無しさん :01/10/16 20:51
>>30
負荷考えると、転送のためだけにcgiのロード〜実行が入るのは
(転送が発生する場合)リクエストあたりの負荷が二倍に(まではいかないにしろ、高く)
なってしまうよね。

mod_rewriteでも導入してくれればそこでいくらでも細工できるんだろうけどなあ。

32 :デフォルトの名無しさん :01/10/16 20:57
mod_rewriteが入ってるならmod_gzipがなくても
index.htmlをindex.html.gzに振れるとかいろいろ夢は広がるんだけど。

33 : ◆HOkHOkkI :01/10/18 02:18
>>6 のスレ立てたの 2 ヶ月位前だから...

34 :デフォルトの名無しさん :01/10/18 03:01
>>33
read.cgiで読み出し時に補完しているのでは?
それができないなら一律に空白を入れるべきだと思います。
つーかもう修正済みらしいのに(>>7-16)
今さらレスつけてるのは何?

35 :デフォルトの名無しさん :01/10/18 04:39
<a href=http//>が入った時期をせつめいしてるだけじゃないのか

36 : ◆HOkHOkkI :01/10/18 13:58
>>34
>つーかもう修正済みらしいのに(>>7-16)
>今さらレスつけてるのは何?
毎日 2ch に来てるわけではないから

37 :デフォルトの名無しさん :01/10/19 01:00
>>36
毎日来ないのと過去レス読まないのは無関係。

38 :(゚Д゚)ハァ?スレ発起人 ◆HOkHOkkI :01/10/19 02:53
>>36
>>33 で言いたかったことは
>>6 のスレを立てたのは転送量(料)の前だから,read.cgi 公開前.
当然このような read.cgi 改良スレができる前.
君たちが文字化け判定で勝手に 0xe0 を外してただけで,
>>6 のスレは狙ったわけではない.」

> 毎日来ないのと過去レス読まないのは無関係。
何処見て >>33 を書いたと思ってるの?
# なぜ高々 >>33 一行のレスに喰いついて来るのか,全くわからない.

39 :デフォルトの名無しさん :01/10/19 02:56
>>38 の "転送量(料)" は "転送量(料)増加問題" のことです...

40 :デフォルトの名無しさん :01/10/19 03:06
>>38
あんたの目的は、[すでに直した]バグを入れた者を非難することか?
非難してどうなるんだ?

41 : ◆HOkHOkkI :01/10/19 03:41
>>40
おれが非難したいのは
いちいち下らないレスを返してくる >>34 >>37 >>40

> あんたの目的は、
どう読んだら非難してるように読めるの?私の目的は
> タイトルの文字化け攻撃が *また* 可能になってるみたいです。
って書いてあったから,「>>6 のスレを立てた者としての釈明」.

# そもそも >>6 のスレは index.html で見たときに
# </font>を壊してスレの見栄えを赤で大きい文字にする為に立てたので,
# read.cgi でどう見えるかは気にしてない.

42 :デフォルトの名無しさん :01/10/19 08:36
ほんと、このスレ感じ悪くなったね。
丁寧な受け答えがなくなって「がいしゅつ」とか「他行け」みたい言い方ばかり。

43 :デフォルトの名無しさん :01/10/19 09:35
>41
とりあえず、「いちいち下らないレスを返してくる」のを非難せずに流せばいいと思う。
もう本人以外誰も気にしてない6に一週間も経ってわざわざ解説付けるから意図を聞かたんでしょうに。
立てたのが2ヶ月前だなんてのはリンク先のスレッドの日付を見ればわかりますって。
スレ立てた本人(他人にはわからないけど)だから気になるってのは理解できるけど、
別に6のスレを非難されてるわけでもないし、変な処理も直ってるんだからもう忘れちゃっていいと思う。
スレ違いコメントなのでsage。

44 : ◆HOkHOkkI :01/10/19 10:59
>>43
了解です.どうもレスつけられっぱなしって苦手なもので...スレ汚しスマソ

45 :デフォルトの名無しさん :01/10/20 01:55
E0を使ったメール欄荒らしがさっそく開発されてますね。
夜勤さん召喚したほうがいいかな?
http://teri.2ch.net/test/read.cgi/accuse/1003508208/l50

46 : ◆YaKIN/eo @夜勤 ★ :01/10/20 05:21
http://salad.2ch.net/baby/kako/

新しい、過去ログ置き場の構造です。
それぞれのフォルダには

xxxxx.html
xxxxx.html.gz
xxxxx.dat.gz

が入っています。
(多分これで変更はないと思います)

47 :デフォルトの名無しさん :01/10/20 05:43
>>46
お疲れ様です。
早速パス構成を変更してみました。
"1aaabccccc" -> "1aaa/1aaab"

参照先の拡張子は .gzつきにはしてませんが、
mod_gzipを当てにできるのかな?

48 :デフォルトの名無しさん :01/10/20 13:57
gzip非対応クライアントではどのみち表示できないんだから
付けないほうがいいね

49 :デフォルトの名無しさん :01/10/20 13:58
あ、mod_gzip非対応鯖のことを忘れてた。
CHECK_MOD_GZIPで場合分けするか

50 : ◆YaKIN/eo @夜勤 ★ :01/10/21 02:29
いつもいつも、皆さんには本当にお世話になっています。

きりが良かったら、教えてください。
入れなおしますので、

51 : ◆DLL/lGHE :01/10/21 02:36
よろしいんじゃないかと思います。
とりあえず最新版。
http://user.freedomainspace.com/bbs/read.tgz

52 :デフォルトの名無しさん :01/10/21 03:00
夜勤さん帰っちゃった?

53 : ◆YaKIN/eo @夜勤 ★ :01/10/21 03:04
では、いれまーす

54 :デフォルトの名無しさん :01/10/21 03:08
がんばれー

55 : ◆YaKIN/eo @夜勤 ★ :01/10/21 03:12
choco に入りました。
#define はなにもさわってません (version 以外)

56 :デフォルトの名無しさん :01/10/21 03:18
>>55
圧縮が効いてないです。
前回同様CHECK_MOD_GZIPをオフにしてください。

57 : ◆YaKIN/eo @夜勤 ★ :01/10/21 03:18
前回やったことを忘れてしまった。。。

choco は、mod_gzip が行っていると見せかけて
実は入っていないサーバです。

58 : ◆YaKIN/eo @夜勤 ★ :01/10/21 03:20
>>56
さんきゅです。
早速 CHECK_MOD_GZIP は、コメントにしました。

59 :デフォルトの名無しさん :01/10/21 03:21
・chocoはオフ
・それ以外はオンのまま
でOKと思われます。
mod_gzipがちゃんと入っている鯖ならGZIPとZLIBも
オフにするとファイルサイズが小さくなっていいかも…

60 :デフォルトの名無しさん :01/10/21 03:22
>>58
chocoで圧縮が有効になったことを確認しました。

61 :デフォルトの名無しさん :01/10/21 03:23
E0のバグが直ったかどうか確かめたいから
teriかpiza2に入れられないでしょうか。

62 : ◆YaKIN/eo @夜勤 ★ :01/10/21 03:25
CHECK_MOD_GZIP を on にしたものを teri にいれますー

63 :デフォルトの名無しさん :01/10/21 03:27
ヽ(`Д´)ノボッキアゲ(自粛)

64 : ◆YaKIN/eo @夜勤 ★ :01/10/21 03:29
teri と piza2 に入れました。

65 :デフォルトの名無しさん :01/10/21 03:29
直ったー
http://teri.2ch.net/test/read.cgi/accuse/1003508208/37-39
圧縮も効いてるようです。めでたしめでたし。

66 : ◆YaKIN/eo @夜勤 ★ :01/10/21 03:31
めでたし、めでたし。

もし、お時間がありましたら
過去ログ倉庫の新構造にも対応していただけるとありがたいです。

67 :デフォルトの名無しさん :01/10/21 03:33
ふっふっふっ。
すでに対応してます。
http://choco.2ch.net/test/read.cgi/ainotane/1003419263/

68 :デフォルトの名無しさん :01/10/21 03:35
teriのようにまだ新形式になってない鯖でも大丈夫です。
http://teri.2ch.net/test/read.cgi/accuse/1002096845/

69 : ◆YaKIN/eo @夜勤 ★ :01/10/21 03:35
すっ すっ すばらしぃ。
おそれいりました。

70 :デフォルトの名無しさん :01/10/21 07:31
tag YAKIN20011021 打ちました。

Ver 5.26での変更点(ChangeLogより)

IEで問題が出たため、文字コードE0hの文字をSJIS1バイト目と判定するようにした。
geturltaillenでのURL終端判定に > と < を追加した
1の本文に>>数字 でない<a href>リンクが本文中に含まれていた場合にタイトルがおかくなっていたバグ修

10桁datの倉庫検索パス変更 "1aaabccccc" -> "1aaa/1aaab"

71 : ◆DLL/lGHE :01/10/22 05:34
rawモードでAccept-Encoding: gzipが付いていないとき、
「なんか不調です。」を返すのではなく強制的にgzip圧縮
したものを返すようにできないでしょうか?
mod_gzipが入っていない鯖で新規にレスを取得できない
という報告が相次いでいるので…

72 :デフォルトの名無しさん :01/10/23 02:28
>>71
RequestのほうでAccept-Encoding: gzipを付ければ完了じゃないんですか?

73 :デフォルトの名無しさん :01/10/23 03:53
WebWasherとかが勝手に削除するんだろ
関連スレに少しは目を通せばいいのに

74 :デフォルトの名無しさん :01/10/23 05:20
>>73
関連スレといっても沢山あるので…
一応いくつも見てはいるんですが。
具体的にどこで話題になっているのか教えていただけますか?

75 :デフォルトの名無しさん :01/10/23 05:25
http://yasai.2ch.net/test/read.cgi/win/1003508243/428
これですか。

これはWebWasherが悪いってことで終了じゃ駄目?

76 :デフォルトの名無しさん :01/10/25 12:30
news鯖とgame鯖もSERVER_SOFTWAREにmod_gzipが
入ってるけど圧縮されないという状態になってるようです。
次回からCHECK_MOD_GZIPはデフォルトでオフに
しませんか?
何か問題あるでしょうか?

77 :デフォルトの名無しさん :01/10/25 13:45
>>76
それが一時的なものかどうかの結論が出てから。
夜勤さん待ちだな。

78 : ◆YaKIN/eo @夜勤 ★ :01/10/25 15:14
誰かいますか?
その news , game サーバの問題なんですが。。。
何が どうなっているのか、わからなくて困ってます。
お助けください。

現状。

game , news に
mod_gzip_item_include file \.dat$ を追加 (.htaccess)

で、
news = 通常の read.cgi
game = choco用の read.cgi
にしました。

79 :名無しさん@MZ-2000 :01/10/25 15:20
2chの動作報告はここで。−4−
http://teri.2ch.net/test/read.cgi/accuse/1003983075/

80 :双葉 ◆4xFuTABA :01/10/25 15:20
2chの動作報告はここで。−4−
http://teri.2ch.net/test/read.cgi/accuse/1003983075/

今までやってきたことはこちらをご覧ください。。。

81 :デフォルトの名無しさん :01/10/25 16:12
age

82 : ◆YaKIN/eo @夜勤 ★ :01/10/25 16:17
じっくりと設定を確認しなおすことにしました。
で、 kaba とか他のサーバの設定と同じになるようにします。

お騒がせしました。

83 :デフォルトの名無しさん :01/10/25 16:23
CHECK_MOD_GZIPをオフにしてもread.cgiのgzip圧縮が効かないってこと?

84 :デフォルトの名無しさん :01/10/25 16:31
>>77
えーと、既存の鯖でCHECK_MOD_GZIPがオフになってると
何か問題があるのでしょうか?
バージョンアップのたびに夜勤さんに余計な負担を掛けな
いで済むならそのほうが望ましいと思うのですが…

85 :デフォルトの名無しさん :01/10/25 16:40
2重に圧縮されるとか?

86 :デフォルトの名無しさん :01/10/25 16:46
>83
CHECK_MOD_GZIPがオフになっていないか、
あるいはCHECK_MOD_GZIP以外にも圧縮ルーチンをスキップする
チェックフラグがあってそれに引っかかっているのかも

87 :デフォルトの名無しさん :01/10/25 16:48
>>85
mod_gzipはContent-Encoding: gzipがすでに吐かれていれば
そのまま素通しするのでそれはない。

88 :デフォルトの名無しさん :01/10/25 17:04
CHECK_MOD_GZIPをオフにすることによるメリットは

・全鯖コンフィグレーションが統一されることにより、
 ヒューマンエラーの可能性が減る。
・何らかの理由でmod_gzipが機能していなくても、
 確実に圧縮した内容を返せる。

これらを上回るようなデメリットがないならオフにしたほうが
いいと思います。

89 :デフォルトの名無しさん :01/10/25 17:30
newsの現状として
mod_gzipが効かなくてread.cgiの圧縮も効いてないってのは
転送量的にかなりマズイのでは、、、

90 :名無しさん :01/10/26 04:30
いま現在スレッドの大きさの上限って何バイトになってるの?

91 :デフォルトの名無しさん :01/10/26 04:50
read2ch.hによると
#define MAX_FILESIZE (8192 * 64)
なんだこの書き方は(´д`;)
512*1024とか書いてくれよう。

ということで512KBになってるね。

92 :名無しさん :01/10/26 04:52
どもども

93 :デフォルトの名無しさん :01/10/26 15:09
http://teri.2ch.net/test/read.cgi/accuse/998393264/994
User-AgentがKatjusha以外のときは、-INCRで全体を送信
にしたほうがよくありませんか?
無駄に二度も接続することになります。

94 :デフォルトの名無しさん :01/10/26 21:07
news鯖はシングルプロセッサだから負荷の問題からあえてオフにしてるのかな?

95 :デフォルトの名無しさん :01/10/27 23:42
>>93
激しく同意

96 : ◆YaKIN/eo @夜勤 ★ :01/10/28 00:49
一般的な処理を User-Agent で分けるのは、いかがなものかと。。。

97 :93 :01/10/28 17:36
現在のraw=.nnnn形式だと、あぼーんがあったときに
結局1からスレを取得するはめになってしまい、リクエストが1回余計にかかってしまいます。
前にあった、raw=n.nだと、あぼーんが検出されたばあい、すべてのレスを返す方法だったと思います。
しかし、更新が無い場合は、+OK 0/512Kを返す(=余計な負荷がかかる)ってことで、
推奨されない方式になってしまいました。
これを304を返すようにすれば、無駄も少なくなるのではないでしょうか?

98 :93 ◆DLL/lGHE :01/10/28 17:37
騙らないでください。

99 :デフォルトの名無しさん :01/10/28 19:39
(俺は最近全然手を加えてないし、何も言う権利は無いんだけど)
言ってることはその通りだと思う。

だけど、接続が無駄って言うけどさ、
Keep-Aliveすら使わないでリクエストの度に接続しなおすクライアントの作りの方が
よっぽど無駄だし、負荷をかけていると思うけどね。

それに、転送量を減らすつもりなら、
俺ならそんな小さな事は後回しにして、
一回のcgiリクエストで複数のdatの差分を取得するような、
マルチリクエストの実装を優先するね。
TCPヘッダ、HTTPヘッダをまとめられるし、
圧縮効果もはるかに高くなるよ。
負荷だって、圧縮負荷は大きくなるけど、
プロセス負荷が減るからトータルでは小さくなるはずだしね。
気が向いたらやってみるよ。

それと、負荷を減らすためには、欠点もあるけどFastCGIが魅力大だね。
プロセス負荷が減るだけでなく、
キャッシュを有効に利用すれば、祭り状態の負荷なんか激減するよ。
マルチスレッドを考えなければ、変更もそんなに多くなくて済む。
まあ、導入できれば、の話だけど。

100 :デフォルトの名無しさん :01/10/28 23:09
UA側で対処すべき事のような。
win板の方は厨房が常駐してるから、批判要望板のかちゅスレに振ってみたら?

152KB
新着レスの表示

スレッドリストへ戻る 全部 前100 次100 最新50

0ch BBS 2004-10-30