■スレッドリストへ戻る■ 全部 1- 101- 201- 301- 401- 501- 601- 最新50
read.cgi改良スレッド 3
- 27 :デフォルトの名無しさん :01/10/16 18:10
- >>26
こういう誤解を招くんでrawモード以外でも
チェックしたほうがいいと思われ
http://teri.2ch.net/test/read.cgi/accuse/988761989/902
- 28 :デフォルトの名無しさん :01/10/16 20:37
- キーの後ろにスラッシュがついていないURLが来たとき、
BASEを吐いてそのまま返すとキャッシュが効かないので
Location: を返すようにできませんか?
- 29 :デフォルトの名無しさん :01/10/16 20:42
- >>28
理想的には全部Locationにしたいけど、それをやると莫大な数の
redirect転送が発生しそうで、果たしてどれだけキャッシュによって
削減できるのかが気になるところ…
過去ログ相手ならいいだろうけど。
- 30 :デフォルトの名無しさん :01/10/16 20:44
- >>29
・IEの履歴のバグや手動で削った場合に発生しやすい
・スレのキーのみのURLは「全レス」であり、巨大になりがち
という理由から、全レスの場合のみLocationにするのが
いいのではないかと。
IEの履歴からたどったということはキャッシュにヒットする
確率も高いでしょうし。
- 31 :デフォルトの名無しさん :01/10/16 20:51
- >>30
負荷考えると、転送のためだけにcgiのロード〜実行が入るのは
(転送が発生する場合)リクエストあたりの負荷が二倍に(まではいかないにしろ、高く)
なってしまうよね。
mod_rewriteでも導入してくれればそこでいくらでも細工できるんだろうけどなあ。
- 32 :デフォルトの名無しさん :01/10/16 20:57
- mod_rewriteが入ってるならmod_gzipがなくても
index.htmlをindex.html.gzに振れるとかいろいろ夢は広がるんだけど。
- 33 : ◆HOkHOkkI :01/10/18 02:18
- >>6 のスレ立てたの 2 ヶ月位前だから...
- 34 :デフォルトの名無しさん :01/10/18 03:01
- >>33
read.cgiで読み出し時に補完しているのでは?
それができないなら一律に空白を入れるべきだと思います。
つーかもう修正済みらしいのに(>>7-16)
今さらレスつけてるのは何?
- 35 :デフォルトの名無しさん :01/10/18 04:39
- <a href=http//>が入った時期をせつめいしてるだけじゃないのか
- 36 : ◆HOkHOkkI :01/10/18 13:58
- >>34
>つーかもう修正済みらしいのに(>>7-16)
>今さらレスつけてるのは何?
毎日 2ch に来てるわけではないから
- 37 :デフォルトの名無しさん :01/10/19 01:00
- >>36
毎日来ないのと過去レス読まないのは無関係。
- 38 :(゚Д゚)ハァ?スレ発起人 ◆HOkHOkkI :01/10/19 02:53
- >>36
>>33 で言いたかったことは
「>>6 のスレを立てたのは転送量(料)の前だから,read.cgi 公開前.
当然このような read.cgi 改良スレができる前.
君たちが文字化け判定で勝手に 0xe0 を外してただけで,
>>6 のスレは狙ったわけではない.」
> 毎日来ないのと過去レス読まないのは無関係。
何処見て >>33 を書いたと思ってるの?
# なぜ高々 >>33 一行のレスに喰いついて来るのか,全くわからない.
- 39 :デフォルトの名無しさん :01/10/19 02:56
- >>38 の "転送量(料)" は "転送量(料)増加問題" のことです...
- 40 :デフォルトの名無しさん :01/10/19 03:06
- >>38
あんたの目的は、[すでに直した]バグを入れた者を非難することか?
非難してどうなるんだ?
- 41 : ◆HOkHOkkI :01/10/19 03:41
- >>40
おれが非難したいのは
いちいち下らないレスを返してくる >>34 >>37 >>40.
> あんたの目的は、
どう読んだら非難してるように読めるの?私の目的は
> タイトルの文字化け攻撃が *また* 可能になってるみたいです。
って書いてあったから,「>>6 のスレを立てた者としての釈明」.
# そもそも >>6 のスレは index.html で見たときに
# </font>を壊してスレの見栄えを赤で大きい文字にする為に立てたので,
# read.cgi でどう見えるかは気にしてない.
- 42 :デフォルトの名無しさん :01/10/19 08:36
- ほんと、このスレ感じ悪くなったね。
丁寧な受け答えがなくなって「がいしゅつ」とか「他行け」みたい言い方ばかり。
- 43 :デフォルトの名無しさん :01/10/19 09:35
- >41
とりあえず、「いちいち下らないレスを返してくる」のを非難せずに流せばいいと思う。
もう本人以外誰も気にしてない6に一週間も経ってわざわざ解説付けるから意図を聞かたんでしょうに。
立てたのが2ヶ月前だなんてのはリンク先のスレッドの日付を見ればわかりますって。
スレ立てた本人(他人にはわからないけど)だから気になるってのは理解できるけど、
別に6のスレを非難されてるわけでもないし、変な処理も直ってるんだからもう忘れちゃっていいと思う。
スレ違いコメントなのでsage。
- 44 : ◆HOkHOkkI :01/10/19 10:59
- >>43
了解です.どうもレスつけられっぱなしって苦手なもので...スレ汚しスマソ
- 45 :デフォルトの名無しさん :01/10/20 01:55
- E0を使ったメール欄荒らしがさっそく開発されてますね。
夜勤さん召喚したほうがいいかな?
http://teri.2ch.net/test/read.cgi/accuse/1003508208/l50
- 46 : ◆YaKIN/eo @夜勤 ★ :01/10/20 05:21
- http://salad.2ch.net/baby/kako/
新しい、過去ログ置き場の構造です。
それぞれのフォルダには
xxxxx.html
xxxxx.html.gz
xxxxx.dat.gz
が入っています。
(多分これで変更はないと思います)
- 47 :デフォルトの名無しさん :01/10/20 05:43
- >>46
お疲れ様です。
早速パス構成を変更してみました。
"1aaabccccc" -> "1aaa/1aaab"
参照先の拡張子は .gzつきにはしてませんが、
mod_gzipを当てにできるのかな?
- 48 :デフォルトの名無しさん :01/10/20 13:57
- gzip非対応クライアントではどのみち表示できないんだから
付けないほうがいいね
- 49 :デフォルトの名無しさん :01/10/20 13:58
- あ、mod_gzip非対応鯖のことを忘れてた。
CHECK_MOD_GZIPで場合分けするか
- 50 : ◆YaKIN/eo @夜勤 ★ :01/10/21 02:29
- いつもいつも、皆さんには本当にお世話になっています。
きりが良かったら、教えてください。
入れなおしますので、
- 51 : ◆DLL/lGHE :01/10/21 02:36
- よろしいんじゃないかと思います。
とりあえず最新版。
http://user.freedomainspace.com/bbs/read.tgz
- 52 :デフォルトの名無しさん :01/10/21 03:00
- 夜勤さん帰っちゃった?
- 53 : ◆YaKIN/eo @夜勤 ★ :01/10/21 03:04
- では、いれまーす
- 54 :デフォルトの名無しさん :01/10/21 03:08
- がんばれー
- 55 : ◆YaKIN/eo @夜勤 ★ :01/10/21 03:12
- choco に入りました。
#define はなにもさわってません (version 以外)
- 56 :デフォルトの名無しさん :01/10/21 03:18
- >>55
圧縮が効いてないです。
前回同様CHECK_MOD_GZIPをオフにしてください。
- 57 : ◆YaKIN/eo @夜勤 ★ :01/10/21 03:18
- 前回やったことを忘れてしまった。。。
choco は、mod_gzip が行っていると見せかけて
実は入っていないサーバです。
- 58 : ◆YaKIN/eo @夜勤 ★ :01/10/21 03:20
- >>56
さんきゅです。
早速 CHECK_MOD_GZIP は、コメントにしました。
- 59 :デフォルトの名無しさん :01/10/21 03:21
- ・chocoはオフ
・それ以外はオンのまま
でOKと思われます。
mod_gzipがちゃんと入っている鯖ならGZIPとZLIBも
オフにするとファイルサイズが小さくなっていいかも…
- 60 :デフォルトの名無しさん :01/10/21 03:22
- >>58
chocoで圧縮が有効になったことを確認しました。
- 61 :デフォルトの名無しさん :01/10/21 03:23
- E0のバグが直ったかどうか確かめたいから
teriかpiza2に入れられないでしょうか。
- 62 : ◆YaKIN/eo @夜勤 ★ :01/10/21 03:25
- CHECK_MOD_GZIP を on にしたものを teri にいれますー
- 63 :デフォルトの名無しさん :01/10/21 03:27
- ヽ(`Д´)ノボッキアゲ(自粛)
- 64 : ◆YaKIN/eo @夜勤 ★ :01/10/21 03:29
- teri と piza2 に入れました。
- 65 :デフォルトの名無しさん :01/10/21 03:29
- 直ったー
http://teri.2ch.net/test/read.cgi/accuse/1003508208/37-39
圧縮も効いてるようです。めでたしめでたし。
- 66 : ◆YaKIN/eo @夜勤 ★ :01/10/21 03:31
- めでたし、めでたし。
もし、お時間がありましたら
過去ログ倉庫の新構造にも対応していただけるとありがたいです。
- 67 :デフォルトの名無しさん :01/10/21 03:33
- ふっふっふっ。
すでに対応してます。
http://choco.2ch.net/test/read.cgi/ainotane/1003419263/
- 68 :デフォルトの名無しさん :01/10/21 03:35
- teriのようにまだ新形式になってない鯖でも大丈夫です。
http://teri.2ch.net/test/read.cgi/accuse/1002096845/
- 69 : ◆YaKIN/eo @夜勤 ★ :01/10/21 03:35
- すっ すっ すばらしぃ。
おそれいりました。
- 70 :デフォルトの名無しさん :01/10/21 07:31
- tag YAKIN20011021 打ちました。
Ver 5.26での変更点(ChangeLogより)
IEで問題が出たため、文字コードE0hの文字をSJIS1バイト目と判定するようにした。
geturltaillenでのURL終端判定に > と < を追加した
1の本文に>>数字 でない<a href>リンクが本文中に含まれていた場合にタイトルがおかくなっていたバグ修
正
10桁datの倉庫検索パス変更 "1aaabccccc" -> "1aaa/1aaab"
- 71 : ◆DLL/lGHE :01/10/22 05:34
- rawモードでAccept-Encoding: gzipが付いていないとき、
「なんか不調です。」を返すのではなく強制的にgzip圧縮
したものを返すようにできないでしょうか?
mod_gzipが入っていない鯖で新規にレスを取得できない
という報告が相次いでいるので…
- 72 :デフォルトの名無しさん :01/10/23 02:28
- >>71
RequestのほうでAccept-Encoding: gzipを付ければ完了じゃないんですか?
- 73 :デフォルトの名無しさん :01/10/23 03:53
- WebWasherとかが勝手に削除するんだろ
関連スレに少しは目を通せばいいのに
- 74 :デフォルトの名無しさん :01/10/23 05:20
- >>73
関連スレといっても沢山あるので…
一応いくつも見てはいるんですが。
具体的にどこで話題になっているのか教えていただけますか?
- 75 :デフォルトの名無しさん :01/10/23 05:25
- http://yasai.2ch.net/test/read.cgi/win/1003508243/428
これですか。
これはWebWasherが悪いってことで終了じゃ駄目?
- 76 :デフォルトの名無しさん :01/10/25 12:30
- news鯖とgame鯖もSERVER_SOFTWAREにmod_gzipが
入ってるけど圧縮されないという状態になってるようです。
次回からCHECK_MOD_GZIPはデフォルトでオフに
しませんか?
何か問題あるでしょうか?
- 77 :デフォルトの名無しさん :01/10/25 13:45
- >>76
それが一時的なものかどうかの結論が出てから。
夜勤さん待ちだな。
- 78 : ◆YaKIN/eo @夜勤 ★ :01/10/25 15:14
- 誰かいますか?
その news , game サーバの問題なんですが。。。
何が どうなっているのか、わからなくて困ってます。
お助けください。
現状。
game , news に
mod_gzip_item_include file \.dat$ を追加 (.htaccess)
で、
news = 通常の read.cgi
game = choco用の read.cgi
にしました。
- 79 :名無しさん@MZ-2000 :01/10/25 15:20
- 2chの動作報告はここで。−4−
http://teri.2ch.net/test/read.cgi/accuse/1003983075/
- 80 :双葉 ◆4xFuTABA :01/10/25 15:20
- 2chの動作報告はここで。−4−
http://teri.2ch.net/test/read.cgi/accuse/1003983075/
今までやってきたことはこちらをご覧ください。。。
- 81 :デフォルトの名無しさん :01/10/25 16:12
- age
- 82 : ◆YaKIN/eo @夜勤 ★ :01/10/25 16:17
- じっくりと設定を確認しなおすことにしました。
で、 kaba とか他のサーバの設定と同じになるようにします。
お騒がせしました。
- 83 :デフォルトの名無しさん :01/10/25 16:23
- CHECK_MOD_GZIPをオフにしてもread.cgiのgzip圧縮が効かないってこと?
- 84 :デフォルトの名無しさん :01/10/25 16:31
- >>77
えーと、既存の鯖でCHECK_MOD_GZIPがオフになってると
何か問題があるのでしょうか?
バージョンアップのたびに夜勤さんに余計な負担を掛けな
いで済むならそのほうが望ましいと思うのですが…
- 85 :デフォルトの名無しさん :01/10/25 16:40
- 2重に圧縮されるとか?
- 86 :デフォルトの名無しさん :01/10/25 16:46
- >83
CHECK_MOD_GZIPがオフになっていないか、
あるいはCHECK_MOD_GZIP以外にも圧縮ルーチンをスキップする
チェックフラグがあってそれに引っかかっているのかも
- 87 :デフォルトの名無しさん :01/10/25 16:48
- >>85
mod_gzipはContent-Encoding: gzipがすでに吐かれていれば
そのまま素通しするのでそれはない。
- 88 :デフォルトの名無しさん :01/10/25 17:04
- CHECK_MOD_GZIPをオフにすることによるメリットは
・全鯖コンフィグレーションが統一されることにより、
ヒューマンエラーの可能性が減る。
・何らかの理由でmod_gzipが機能していなくても、
確実に圧縮した内容を返せる。
これらを上回るようなデメリットがないならオフにしたほうが
いいと思います。
- 89 :デフォルトの名無しさん :01/10/25 17:30
- newsの現状として
mod_gzipが効かなくてread.cgiの圧縮も効いてないってのは
転送量的にかなりマズイのでは、、、
- 90 :名無しさん :01/10/26 04:30
- いま現在スレッドの大きさの上限って何バイトになってるの?
- 91 :デフォルトの名無しさん :01/10/26 04:50
- read2ch.hによると
#define MAX_FILESIZE (8192 * 64)
なんだこの書き方は(´д`;)
512*1024とか書いてくれよう。
ということで512KBになってるね。
- 92 :名無しさん :01/10/26 04:52
- どもども
- 93 :デフォルトの名無しさん :01/10/26 15:09
- http://teri.2ch.net/test/read.cgi/accuse/998393264/994
User-AgentがKatjusha以外のときは、-INCRで全体を送信
にしたほうがよくありませんか?
無駄に二度も接続することになります。
- 94 :デフォルトの名無しさん :01/10/26 21:07
- news鯖はシングルプロセッサだから負荷の問題からあえてオフにしてるのかな?
- 95 :デフォルトの名無しさん :01/10/27 23:42
- >>93
激しく同意
- 96 : ◆YaKIN/eo @夜勤 ★ :01/10/28 00:49
- 一般的な処理を User-Agent で分けるのは、いかがなものかと。。。
- 97 :93 :01/10/28 17:36
- 現在のraw=.nnnn形式だと、あぼーんがあったときに
結局1からスレを取得するはめになってしまい、リクエストが1回余計にかかってしまいます。
前にあった、raw=n.nだと、あぼーんが検出されたばあい、すべてのレスを返す方法だったと思います。
しかし、更新が無い場合は、+OK 0/512Kを返す(=余計な負荷がかかる)ってことで、
推奨されない方式になってしまいました。
これを304を返すようにすれば、無駄も少なくなるのではないでしょうか?
- 98 :93 ◆DLL/lGHE :01/10/28 17:37
- 騙らないでください。
- 99 :デフォルトの名無しさん :01/10/28 19:39
- (俺は最近全然手を加えてないし、何も言う権利は無いんだけど)
言ってることはその通りだと思う。
だけど、接続が無駄って言うけどさ、
Keep-Aliveすら使わないでリクエストの度に接続しなおすクライアントの作りの方が
よっぽど無駄だし、負荷をかけていると思うけどね。
それに、転送量を減らすつもりなら、
俺ならそんな小さな事は後回しにして、
一回のcgiリクエストで複数のdatの差分を取得するような、
マルチリクエストの実装を優先するね。
TCPヘッダ、HTTPヘッダをまとめられるし、
圧縮効果もはるかに高くなるよ。
負荷だって、圧縮負荷は大きくなるけど、
プロセス負荷が減るからトータルでは小さくなるはずだしね。
気が向いたらやってみるよ。
それと、負荷を減らすためには、欠点もあるけどFastCGIが魅力大だね。
プロセス負荷が減るだけでなく、
キャッシュを有効に利用すれば、祭り状態の負荷なんか激減するよ。
マルチスレッドを考えなければ、変更もそんなに多くなくて済む。
まあ、導入できれば、の話だけど。
- 100 :デフォルトの名無しさん :01/10/28 23:09
- UA側で対処すべき事のような。
win板の方は厨房が常駐してるから、批判要望板のかちゅスレに振ってみたら?
- 101 :デフォルトの名無しさん :01/10/28 23:13
- cgiがマルチリクエストをサポートしていなかったら
どうにもならないような。
せいぜいKeep-Aliveを使うくらい?
- 102 :デフォルトの名無しさん :01/10/28 23:26
- UA側がIf-Modified-Since付けてくれれば、
raw=n.nで何の問題もないんだけど。
一度の接続で大丈夫だし、必要なときしかファイル読まないし。
- 103 :デフォルトの名無しさん :01/10/28 23:32
- それだとなぜか更新を検出しないことが多いからやめたんだと
(dat直読みのときの話だからFORCE_304_TIMEとは関係ない)
- 104 :デフォルトの名無しさん :01/10/29 00:35
- 細かいけど、
・raw=n.nはraw=.nより負荷がかかる(全体を走査するから)
・If-Modified-SinceのFORCE_304_TIMEはraw=n.nの時も有効
のはず。
- 105 :デフォルトの名無しさん :01/10/29 00:36
- いやだから「dat直読みのときの話だから」
read.cgiは関係ないんだってば
- 106 :名無しさん@MZ-2000 :01/10/31 15:47
- bbs.cgiの動作チェックのためのスレッド
http://teri.2ch.net/test/read.cgi/accuse/1001913490/
のスレで話が出たんですが、
http://www.google.co.jp/search?hl=ja&q=site%3A2ch.net+%96%E9%8B%CE+YaKIN%2Feo+%81%9A&lr=
PATH_INFO 形式の URL は Google の巡回対象になるようです。
中身のリンクもすべて巡回されるので、転送量もかなりのものになると
思われます。
read.cgi にボット除けを入れたほうがいいかと思うのですが、どうでしょう?
- 107 :デフォルトの名無しさん :01/10/31 15:58
- robots.txtを入れるという話になってたのでは
http://piza2.2ch.net/tech/kako/998/998845501.html
ここの285-286
- 108 :デフォルトの名無しさん :01/10/31 16:04
- CGIで対応するとしたら、
1)BadAccess()でロボットっぽいURLを弾く
2)METAタグで巡回をご遠慮願う
3)URLの末尾に ? を付ける
などのオプションが考えられます。
- 109 :デフォルトの名無しさん :01/10/31 17:01
- マルチリクエスト、だいたいできたよ。
まだcommitしてないけど。
仕様としては、
(path)/test/read.cgi?raw=0.0&dat=board/999999999.12345&dat=board2/999888777.2345&board3/999777666.345
という形にするつもり。
同じboardが連続する時は、2番目からはboard/を省略可能とした。
レスポンスには、全体のサイズは返さず(返せない)、
+OK 1234/512K Request:board/999999999.12345 LastModify:1003111222
・・・
+OK 0/512K Request:board2/999888777 LastModify:1000000000
+OK 4567/512K Request:board3/999777666.345 LastModify:1003222333
・・・
が続くようにする。
"."以降を既得サイズとするが、差分に限定するため(上位50件の全取得等に使われないため)に、
".0"は受け付けないことにした。
ただし、".0"(0以下も含む)の時はエラー扱いせずに
+OK 0/512K
を返すようにした。
また、Last-Modifiedはtime()の数値のまま、ヘッダの"Lastmodify:"に入れた。
それと、一応リクエスト側のことを考えて、"&dat="以下の内容を
ヘッダの"Request:"にboard/key.diffの形式で入れた(boardは補完して)。
また、-ERR時に、文字列比較をしなければいけないのが疑問だったので、
この形式の時だけ、エラーコードを入れるようにした。
UA側が一通りこの形式に対応したら、
他の(rawモードの)エラーにもエラーコードを含めるようにしたい。
(その場合は、Request:やLastModify:は含まれない)
例)
-ERR 200 そんな板orスレッドないです。Request:tech/999999999.12345
-ERR 201 過去ログ倉庫で発見 ../tech/kako/100/1000000003.datRequest:tech/1000000003.123
-ERR 201 過去ログ倉庫で発見 ../tech/kako/100/1000000005.dat.gzRequest:tech/1000000005.123
-ERR 202 html化待ちRequest:tech/1000000001.123
-ERR 600 どこかであぼーんがあったみたいです。Request:tech/1002820903.24646LastModify:1004511622
- 110 :エラー長過ぎる行があります :01/10/31 17:02
- 注意点としては、板別のセッティングを読みこまない(読みこめない)ので、
返される/512Kはただのデフォルト値であり信用できない、
そのため、通常の形式では読めないdatが読めてしまう可能性もある、
というのがある。
また、path形式(で板を指定)だと内部的に気持ちがよくないことが起こるので、
通常のquery_stringのみとした。
また、有効になるのは、raw=0.0で、bbs=とkey=が指定されていない時のみとした。
一括して受け付ける最大数は一応50とした。
apacheのGETリクエスト長制限とどちらが先に来るかは知らない。
とりあえず、例。
read.cgi?raw=0.0&dat=tech/1000035521.345329&dat=1002820903.24648
&dat=981726544.321672&dat=998908559.51344&dat=tech/967778156.59818
&prog/949623869.77371&dat=prog/980900290.146756&dat=1000335545.186069
&dat=unix/999166513.243075&dat=win/1003508243.184355&dat=1004351681.49566
&dat=software/1004096526.38369
+OK 0/512KRequest:tech/1000035521.345329LastModify:1004361816
+OK 680/512KRequest:tech/1002820903.24648LastModify:1004511622
・・・
+OK 0/512KRequest:tech/981726544.321672LastModify:1004467586
+OK 0/512KRequest:tech/998908559.51344LastModify:1004177482
+OK 0/512KRequest:tech/967778156.59818LastModify:1003324384
+OK 2877/512KRequest:prog/980900290.146756LastModify:1004504546
・・・
+OK 398/512KRequest:prog/1000335545.186069LastModify:1004511632
・・・
+OK 1827/512KRequest:unix/999166513.243075LastModify:1004504560
・・・
+OK 0/512KRequest:win/1003508243.184355LastModify:1004024020
+OK 2900/512KRequest:win/1004351681.49566LastModify:1004511770
・・・
+OK 7808/512KRequest:software/1004096526.38369LastModify:1004511760
・・・
なんかまずい点とかあったら指摘お願い。
- 111 :デフォルトの名無しさん :01/10/31 17:43
- 一応commitした。
おかしい所やバグなどがあったら、直してくださいな。
- 112 :デフォルトの名無しさん :01/10/31 17:51
- 今度同鯖を巡回するクライアントはマルチリクエストを
使用することが推奨される…と。
- 113 :デフォルトの名無しさん :01/10/31 18:16
- >>108
1) : いちいちチェックするコストがもったいない(接続要求は腐る程ある).
2) : 最初の1回は META を読むために HTML の転送が発生してしまう.
3) : せっかくきれいな PATH_INFO url が汚くなる(私見).
って感じなので robots.txt がコスト的にも一番良いと思う.
- 114 :デフォルトの名無しさん :01/10/31 18:29
- http://<鯖名>.2ch.net/robot.txt を作って
User-agent: *
Disallow: /test/
って書いて、 read.cgi は巡回されずに過去ログはいままでどおり
巡回してくれるってのがいいな。
- 115 :名無しさん :01/10/31 19:50
- PATH_INFOをやめて元に戻すのが一番スマートな解のような
- 116 :デフォルトの名無しさん :01/10/31 19:55
- robots.txtのほうがスマートだと思うな。
どっちにしろロボットは必ずrobots.txtを一発取りに来るし
過去ログとかも同様に制限できるしね。
- 117 :デフォルトの名無しさん :01/10/31 20:56
- Disallow: /test/read.cgi/tech/*/
みたいな指定はできないんですか?
- 118 :デフォルトの名無しさん :01/10/31 22:42
- できると思うけど /test/ でいいんじゃない?
全板まとめて規制できるし。
- 119 :デフォルトの名無しさん :01/11/01 02:33
- http://pc.2ch.net/test/read.cgi/tech/100282090
みたいな間違ったリクエストをした時でも、ステータスは
200 OKが返っていますけど、これは、404 Not Foundを返すようにした方がいいんじゃありません?
- 120 :一スレ800件!! :01/11/01 05:47
- ちょっとこれを見てやって下さいよ。
ttp://www.google.com/search?num=100&q=read.cgi+%89%FC%97%C7%83X%83%8C%83b%83h+site%3Apiza2.2ch.net
ここまでくると、検索エンジン荒しと見紛う勢いです。。。
- 121 :120 :01/11/01 05:48
- しかも全て準デッドリンクだし。。。。
- 122 :デフォルトの名無しさん :01/11/01 10:11
- >>119
無意味にキャッシュが効かなくなるだけ。何がいいのかわからん。
- 123 :名無しさん :01/11/01 15:28
- >>120
ワロタ
- 124 :デフォルトの名無しさん :01/11/01 15:31
- site:を付けずに検索すればちゃんとまとまるじゃん。
http://www.google.com/search?num=100&hl=ja&q=read.cgi+%89%FC%97%C7%83X%83%8C%83b%83h&lr=
- 125 :デフォルトの名無しさん :01/11/01 16:43
- >>124 カキコの趣旨が違うと思う。
移転してもうないにもかかわらず、一つのスレに対して800件もヒットさせてしまう,
悲惨なGooglebotを晒し上げているのでしょう。
- 126 :デフォルトの名無しさん :01/11/01 16:51
- 得意げな顔して何が、800件ヒットしました、だ。
お前は本当にキャッシュを更新してるのかと問いたい。問い詰めたい。小1時間問い詰めたい。
お前、個人情報を晒しあげたいだけちゃうんかと。
検索ロボット通の俺から言わせてもらえば今、検索ロボット通の間での最新流行はやっぱり、
http://web.archive.org/、これだね。
http://web.archive.org/*/にURLを追加。これが通の検索の仕方。
http://web.archive.org/ってのは昔のコンテンツが多めに入ってる。そん代わり著作権への配慮が少なめ。これ。
で、それにNOARCHIVEタグ無視。これ最強。
しかしこれを晒すと次から自分のページも晒し上げられるという危険も伴う、諸刃の剣。
素人にはお薦め出来ない。
まあお前、夜勤 ★は、robots.txtでも置いてなさいってこった。
152KB
新着レスの表示
スレッドリストへ戻る 全部 前100 次100 最新50
0ch BBS 2004-10-30