■スレッドリストへ戻る■ 全部 1- 101- 201- 301- 401- 501- 601- 最新50
read.cgi改良スレッド 3
- 43 :デフォルトの名無しさん :01/10/19 09:35
 -  >41 
 とりあえず、「いちいち下らないレスを返してくる」のを非難せずに流せばいいと思う。 
 もう本人以外誰も気にしてない6に一週間も経ってわざわざ解説付けるから意図を聞かたんでしょうに。 
 立てたのが2ヶ月前だなんてのはリンク先のスレッドの日付を見ればわかりますって。 
 スレ立てた本人(他人にはわからないけど)だから気になるってのは理解できるけど、 
 別に6のスレを非難されてるわけでもないし、変な処理も直ってるんだからもう忘れちゃっていいと思う。 
 スレ違いコメントなのでsage。 
 
- 44 : ◆HOkHOkkI  :01/10/19 10:59
 -  >>43 
 了解です.どうもレスつけられっぱなしって苦手なもので...スレ汚しスマソ 
 
- 45 :デフォルトの名無しさん :01/10/20 01:55
 -  E0を使ったメール欄荒らしがさっそく開発されてますね。 
 夜勤さん召喚したほうがいいかな? 
 http://teri.2ch.net/test/read.cgi/accuse/1003508208/l50 
 
- 46 : ◆YaKIN/eo @夜勤 ★ :01/10/20 05:21
 -  http://salad.2ch.net/baby/kako/ 
  
 新しい、過去ログ置き場の構造です。 
 それぞれのフォルダには 
  
 xxxxx.html 
 xxxxx.html.gz 
 xxxxx.dat.gz 
  
 が入っています。 
 (多分これで変更はないと思います) 
 
- 47 :デフォルトの名無しさん :01/10/20 05:43
 -  >>46 
 お疲れ様です。 
 早速パス構成を変更してみました。 
 "1aaabccccc" -> "1aaa/1aaab" 
  
 参照先の拡張子は .gzつきにはしてませんが、 
 mod_gzipを当てにできるのかな? 
 
- 48 :デフォルトの名無しさん :01/10/20 13:57
 -  gzip非対応クライアントではどのみち表示できないんだから 
 付けないほうがいいね 
 
- 49 :デフォルトの名無しさん :01/10/20 13:58
 -  あ、mod_gzip非対応鯖のことを忘れてた。 
 CHECK_MOD_GZIPで場合分けするか 
 
- 50 : ◆YaKIN/eo @夜勤 ★ :01/10/21 02:29
 -  いつもいつも、皆さんには本当にお世話になっています。 
  
 きりが良かったら、教えてください。 
 入れなおしますので、 
 
- 51 : ◆DLL/lGHE  :01/10/21 02:36
 -  よろしいんじゃないかと思います。 
 とりあえず最新版。 
 http://user.freedomainspace.com/bbs/read.tgz 
 
- 52 :デフォルトの名無しさん :01/10/21 03:00
 -  夜勤さん帰っちゃった? 
 
- 53 : ◆YaKIN/eo @夜勤 ★ :01/10/21 03:04
 -  では、いれまーす 
 
- 54 :デフォルトの名無しさん :01/10/21 03:08
 -  がんばれー 
 
- 55 : ◆YaKIN/eo @夜勤 ★ :01/10/21 03:12
 -  choco に入りました。 
 #define はなにもさわってません (version 以外) 
 
- 56 :デフォルトの名無しさん :01/10/21 03:18
 -  >>55 
 圧縮が効いてないです。 
 前回同様CHECK_MOD_GZIPをオフにしてください。 
 
- 57 : ◆YaKIN/eo @夜勤 ★ :01/10/21 03:18
 -  前回やったことを忘れてしまった。。。 
  
 choco は、mod_gzip が行っていると見せかけて 
 実は入っていないサーバです。 
 
- 58 : ◆YaKIN/eo @夜勤 ★ :01/10/21 03:20
 -  >>56 
 さんきゅです。 
 早速 CHECK_MOD_GZIP は、コメントにしました。 
 
- 59 :デフォルトの名無しさん :01/10/21 03:21
 -  ・chocoはオフ 
 ・それ以外はオンのまま 
 でOKと思われます。 
 mod_gzipがちゃんと入っている鯖ならGZIPとZLIBも 
 オフにするとファイルサイズが小さくなっていいかも… 
 
- 60 :デフォルトの名無しさん :01/10/21 03:22
 -  >>58 
 chocoで圧縮が有効になったことを確認しました。 
 
- 61 :デフォルトの名無しさん :01/10/21 03:23
 -  E0のバグが直ったかどうか確かめたいから 
 teriかpiza2に入れられないでしょうか。 
 
- 62 : ◆YaKIN/eo @夜勤 ★ :01/10/21 03:25
 -  CHECK_MOD_GZIP を on にしたものを teri にいれますー 
 
- 63 :デフォルトの名無しさん :01/10/21 03:27
 -  ヽ(`Д´)ノボッキアゲ(自粛) 
 
- 64 : ◆YaKIN/eo @夜勤 ★ :01/10/21 03:29
 -  teri と piza2 に入れました。 
 
- 65 :デフォルトの名無しさん :01/10/21 03:29
 -  直ったー 
 http://teri.2ch.net/test/read.cgi/accuse/1003508208/37-39 
 圧縮も効いてるようです。めでたしめでたし。 
 
- 66 : ◆YaKIN/eo @夜勤 ★ :01/10/21 03:31
 -  めでたし、めでたし。 
  
 もし、お時間がありましたら 
 過去ログ倉庫の新構造にも対応していただけるとありがたいです。 
 
- 67 :デフォルトの名無しさん :01/10/21 03:33
 -  ふっふっふっ。 
 すでに対応してます。 
 http://choco.2ch.net/test/read.cgi/ainotane/1003419263/ 
 
- 68 :デフォルトの名無しさん :01/10/21 03:35
 -  teriのようにまだ新形式になってない鯖でも大丈夫です。 
 http://teri.2ch.net/test/read.cgi/accuse/1002096845/ 
 
- 69 : ◆YaKIN/eo @夜勤 ★ :01/10/21 03:35
 -  すっ すっ すばらしぃ。 
 おそれいりました。 
 
- 70 :デフォルトの名無しさん :01/10/21 07:31
 -  tag YAKIN20011021 打ちました。 
  
 Ver 5.26での変更点(ChangeLogより) 
  
   IEで問題が出たため、文字コードE0hの文字をSJIS1バイト目と判定するようにした。 
   geturltaillenでのURL終端判定に > と < を追加した 
   1の本文に>>数字 でない<a href>リンクが本文中に含まれていた場合にタイトルがおかくなっていたバグ修 
 正 
   10桁datの倉庫検索パス変更 "1aaabccccc" -> "1aaa/1aaab" 
 
- 71 : ◆DLL/lGHE  :01/10/22 05:34
 -  rawモードでAccept-Encoding: gzipが付いていないとき、 
 「なんか不調です。」を返すのではなく強制的にgzip圧縮 
 したものを返すようにできないでしょうか? 
 mod_gzipが入っていない鯖で新規にレスを取得できない 
 という報告が相次いでいるので… 
 
- 72 :デフォルトの名無しさん :01/10/23 02:28
 -  >>71 
 RequestのほうでAccept-Encoding: gzipを付ければ完了じゃないんですか? 
 
- 73 :デフォルトの名無しさん :01/10/23 03:53
 -  WebWasherとかが勝手に削除するんだろ 
 関連スレに少しは目を通せばいいのに 
 
- 74 :デフォルトの名無しさん :01/10/23 05:20
 -  >>73 
 関連スレといっても沢山あるので… 
 一応いくつも見てはいるんですが。 
 具体的にどこで話題になっているのか教えていただけますか? 
 
- 75 :デフォルトの名無しさん :01/10/23 05:25
 -  http://yasai.2ch.net/test/read.cgi/win/1003508243/428 
 これですか。 
  
 これはWebWasherが悪いってことで終了じゃ駄目? 
 
- 76 :デフォルトの名無しさん :01/10/25 12:30
 -  news鯖とgame鯖もSERVER_SOFTWAREにmod_gzipが 
 入ってるけど圧縮されないという状態になってるようです。 
 次回からCHECK_MOD_GZIPはデフォルトでオフに 
 しませんか? 
 何か問題あるでしょうか? 
 
- 77 :デフォルトの名無しさん :01/10/25 13:45
 -  >>76 
 それが一時的なものかどうかの結論が出てから。 
 夜勤さん待ちだな。 
 
- 78 : ◆YaKIN/eo @夜勤 ★ :01/10/25 15:14
 -  誰かいますか? 
 その news , game サーバの問題なんですが。。。 
 何が どうなっているのか、わからなくて困ってます。 
 お助けください。 
  
 現状。 
  
 game , news に 
 mod_gzip_item_include file \.dat$ を追加 (.htaccess) 
  
 で、 
 news = 通常の read.cgi 
 game = choco用の read.cgi 
 にしました。  
 
- 79 :名無しさん@MZ-2000 :01/10/25 15:20
 -  2chの動作報告はここで。−4− 
 http://teri.2ch.net/test/read.cgi/accuse/1003983075/ 
 
- 80 :双葉 ◆4xFuTABA  :01/10/25 15:20
 -  2chの動作報告はここで。−4− 
 http://teri.2ch.net/test/read.cgi/accuse/1003983075/ 
  
 今までやってきたことはこちらをご覧ください。。。 
 
- 81 :デフォルトの名無しさん :01/10/25 16:12
 -  age 
 
- 82 : ◆YaKIN/eo @夜勤 ★ :01/10/25 16:17
 -  じっくりと設定を確認しなおすことにしました。 
 で、 kaba とか他のサーバの設定と同じになるようにします。 
  
 お騒がせしました。 
 
- 83 :デフォルトの名無しさん :01/10/25 16:23
 -  CHECK_MOD_GZIPをオフにしてもread.cgiのgzip圧縮が効かないってこと? 
 
- 84 :デフォルトの名無しさん :01/10/25 16:31
 -  >>77 
 えーと、既存の鯖でCHECK_MOD_GZIPがオフになってると 
 何か問題があるのでしょうか? 
 バージョンアップのたびに夜勤さんに余計な負担を掛けな 
 いで済むならそのほうが望ましいと思うのですが… 
 
- 85 :デフォルトの名無しさん :01/10/25 16:40
 -  2重に圧縮されるとか? 
 
- 86 :デフォルトの名無しさん :01/10/25 16:46
 -  >83 
 CHECK_MOD_GZIPがオフになっていないか、 
 あるいはCHECK_MOD_GZIP以外にも圧縮ルーチンをスキップする 
 チェックフラグがあってそれに引っかかっているのかも 
 
- 87 :デフォルトの名無しさん :01/10/25 16:48
 -  >>85 
 mod_gzipはContent-Encoding: gzipがすでに吐かれていれば 
 そのまま素通しするのでそれはない。 
 
- 88 :デフォルトの名無しさん :01/10/25 17:04
 -  CHECK_MOD_GZIPをオフにすることによるメリットは 
  
 ・全鯖コンフィグレーションが統一されることにより、 
  ヒューマンエラーの可能性が減る。 
 ・何らかの理由でmod_gzipが機能していなくても、 
  確実に圧縮した内容を返せる。 
  
 これらを上回るようなデメリットがないならオフにしたほうが 
 いいと思います。 
 
- 89 :デフォルトの名無しさん :01/10/25 17:30
 -  newsの現状として 
 mod_gzipが効かなくてread.cgiの圧縮も効いてないってのは 
 転送量的にかなりマズイのでは、、、 
 
- 90 :名無しさん :01/10/26 04:30
 -  いま現在スレッドの大きさの上限って何バイトになってるの? 
 
- 91 :デフォルトの名無しさん :01/10/26 04:50
 -  read2ch.hによると 
 #define MAX_FILESIZE    (8192 * 64) 
 なんだこの書き方は(´д`;) 
 512*1024とか書いてくれよう。 
  
 ということで512KBになってるね。 
 
- 92 :名無しさん :01/10/26 04:52
 -  どもども 
 
- 93 :デフォルトの名無しさん :01/10/26 15:09
 -  http://teri.2ch.net/test/read.cgi/accuse/998393264/994 
 User-AgentがKatjusha以外のときは、-INCRで全体を送信 
 にしたほうがよくありませんか? 
 無駄に二度も接続することになります。 
 
- 94 :デフォルトの名無しさん :01/10/26 21:07
 -  news鯖はシングルプロセッサだから負荷の問題からあえてオフにしてるのかな? 
 
- 95 :デフォルトの名無しさん :01/10/27 23:42
 -  >>93 
 激しく同意 
 
- 96 : ◆YaKIN/eo @夜勤 ★ :01/10/28 00:49
 -  一般的な処理を User-Agent で分けるのは、いかがなものかと。。。 
 
- 97 :93 :01/10/28 17:36
 -  現在のraw=.nnnn形式だと、あぼーんがあったときに 
 結局1からスレを取得するはめになってしまい、リクエストが1回余計にかかってしまいます。 
 前にあった、raw=n.nだと、あぼーんが検出されたばあい、すべてのレスを返す方法だったと思います。 
 しかし、更新が無い場合は、+OK 0/512Kを返す(=余計な負荷がかかる)ってことで、 
 推奨されない方式になってしまいました。 
 これを304を返すようにすれば、無駄も少なくなるのではないでしょうか? 
 
- 98 :93 ◆DLL/lGHE  :01/10/28 17:37
 -  騙らないでください。 
 
- 99 :デフォルトの名無しさん :01/10/28 19:39
 -  (俺は最近全然手を加えてないし、何も言う権利は無いんだけど) 
 言ってることはその通りだと思う。 
  
 だけど、接続が無駄って言うけどさ、 
 Keep-Aliveすら使わないでリクエストの度に接続しなおすクライアントの作りの方が 
 よっぽど無駄だし、負荷をかけていると思うけどね。 
  
 それに、転送量を減らすつもりなら、 
 俺ならそんな小さな事は後回しにして、 
 一回のcgiリクエストで複数のdatの差分を取得するような、 
 マルチリクエストの実装を優先するね。 
 TCPヘッダ、HTTPヘッダをまとめられるし、 
 圧縮効果もはるかに高くなるよ。 
 負荷だって、圧縮負荷は大きくなるけど、 
 プロセス負荷が減るからトータルでは小さくなるはずだしね。 
 気が向いたらやってみるよ。 
  
 それと、負荷を減らすためには、欠点もあるけどFastCGIが魅力大だね。 
 プロセス負荷が減るだけでなく、 
 キャッシュを有効に利用すれば、祭り状態の負荷なんか激減するよ。 
 マルチスレッドを考えなければ、変更もそんなに多くなくて済む。 
 まあ、導入できれば、の話だけど。 
 
- 100 :デフォルトの名無しさん :01/10/28 23:09
 -  UA側で対処すべき事のような。 
 win板の方は厨房が常駐してるから、批判要望板のかちゅスレに振ってみたら? 
 
- 101 :デフォルトの名無しさん :01/10/28 23:13
 -  cgiがマルチリクエストをサポートしていなかったら 
 どうにもならないような。 
 せいぜいKeep-Aliveを使うくらい? 
 
- 102 :デフォルトの名無しさん :01/10/28 23:26
 -  UA側がIf-Modified-Since付けてくれれば、 
 raw=n.nで何の問題もないんだけど。 
  
 一度の接続で大丈夫だし、必要なときしかファイル読まないし。 
 
- 103 :デフォルトの名無しさん :01/10/28 23:32
 -  それだとなぜか更新を検出しないことが多いからやめたんだと 
 (dat直読みのときの話だからFORCE_304_TIMEとは関係ない) 
 
- 104 :デフォルトの名無しさん :01/10/29 00:35
 -  細かいけど、 
 ・raw=n.nはraw=.nより負荷がかかる(全体を走査するから) 
 ・If-Modified-SinceのFORCE_304_TIMEはraw=n.nの時も有効 
 のはず。 
 
- 105 :デフォルトの名無しさん :01/10/29 00:36
 -  いやだから「dat直読みのときの話だから」 
 read.cgiは関係ないんだってば 
 
- 106 :名無しさん@MZ-2000 :01/10/31 15:47
 -  bbs.cgiの動作チェックのためのスレッド 
 http://teri.2ch.net/test/read.cgi/accuse/1001913490/ 
  
 のスレで話が出たんですが、 
  
 http://www.google.co.jp/search?hl=ja&q=site%3A2ch.net+%96%E9%8B%CE+YaKIN%2Feo+%81%9A&lr= 
  
 PATH_INFO 形式の URL は Google の巡回対象になるようです。 
 中身のリンクもすべて巡回されるので、転送量もかなりのものになると 
 思われます。 
 read.cgi にボット除けを入れたほうがいいかと思うのですが、どうでしょう? 
 
- 107 :デフォルトの名無しさん :01/10/31 15:58
 -  robots.txtを入れるという話になってたのでは 
 http://piza2.2ch.net/tech/kako/998/998845501.html 
 ここの285-286 
 
- 108 :デフォルトの名無しさん :01/10/31 16:04
 -  CGIで対応するとしたら、 
 1)BadAccess()でロボットっぽいURLを弾く 
 2)METAタグで巡回をご遠慮願う 
 3)URLの末尾に ? を付ける 
 などのオプションが考えられます。 
 
- 109 :デフォルトの名無しさん :01/10/31 17:01
 -  マルチリクエスト、だいたいできたよ。 
 まだcommitしてないけど。 
  
 仕様としては、 
 (path)/test/read.cgi?raw=0.0&dat=board/999999999.12345&dat=board2/999888777.2345&board3/999777666.345 
 という形にするつもり。 
 同じboardが連続する時は、2番目からはboard/を省略可能とした。 
 レスポンスには、全体のサイズは返さず(返せない)、 
 +OK 1234/512K Request:board/999999999.12345 LastModify:1003111222 
 ・・・ 
 +OK 0/512K Request:board2/999888777 LastModify:1000000000 
 +OK 4567/512K Request:board3/999777666.345 LastModify:1003222333 
 ・・・ 
 が続くようにする。 
  
 "."以降を既得サイズとするが、差分に限定するため(上位50件の全取得等に使われないため)に、 
 ".0"は受け付けないことにした。 
 ただし、".0"(0以下も含む)の時はエラー扱いせずに 
 +OK 0/512K 
 を返すようにした。 
 また、Last-Modifiedはtime()の数値のまま、ヘッダの"Lastmodify:"に入れた。 
 それと、一応リクエスト側のことを考えて、"&dat="以下の内容を 
 ヘッダの"Request:"にboard/key.diffの形式で入れた(boardは補完して)。 
  
 また、-ERR時に、文字列比較をしなければいけないのが疑問だったので、 
 この形式の時だけ、エラーコードを入れるようにした。 
 UA側が一通りこの形式に対応したら、 
 他の(rawモードの)エラーにもエラーコードを含めるようにしたい。 
 (その場合は、Request:やLastModify:は含まれない) 
 例) 
 -ERR 200 そんな板orスレッドないです。Request:tech/999999999.12345 
 -ERR 201 過去ログ倉庫で発見 ../tech/kako/100/1000000003.datRequest:tech/1000000003.123 
 -ERR 201 過去ログ倉庫で発見 ../tech/kako/100/1000000005.dat.gzRequest:tech/1000000005.123 
 -ERR 202 html化待ちRequest:tech/1000000001.123 
 -ERR 600 どこかであぼーんがあったみたいです。Request:tech/1002820903.24646LastModify:1004511622 
 
- 110 :エラー長過ぎる行があります :01/10/31 17:02
 -  注意点としては、板別のセッティングを読みこまない(読みこめない)ので、 
 返される/512Kはただのデフォルト値であり信用できない、 
 そのため、通常の形式では読めないdatが読めてしまう可能性もある、 
 というのがある。 
 また、path形式(で板を指定)だと内部的に気持ちがよくないことが起こるので、 
 通常のquery_stringのみとした。 
  
 また、有効になるのは、raw=0.0で、bbs=とkey=が指定されていない時のみとした。 
 一括して受け付ける最大数は一応50とした。 
 apacheのGETリクエスト長制限とどちらが先に来るかは知らない。 
  
 とりあえず、例。 
 read.cgi?raw=0.0&dat=tech/1000035521.345329&dat=1002820903.24648 
 &dat=981726544.321672&dat=998908559.51344&dat=tech/967778156.59818 
 &prog/949623869.77371&dat=prog/980900290.146756&dat=1000335545.186069 
 &dat=unix/999166513.243075&dat=win/1003508243.184355&dat=1004351681.49566 
 &dat=software/1004096526.38369 
  
 +OK 0/512KRequest:tech/1000035521.345329LastModify:1004361816 
 +OK 680/512KRequest:tech/1002820903.24648LastModify:1004511622 
 ・・・ 
 +OK 0/512KRequest:tech/981726544.321672LastModify:1004467586 
 +OK 0/512KRequest:tech/998908559.51344LastModify:1004177482 
 +OK 0/512KRequest:tech/967778156.59818LastModify:1003324384 
 +OK 2877/512KRequest:prog/980900290.146756LastModify:1004504546 
 ・・・ 
 +OK 398/512KRequest:prog/1000335545.186069LastModify:1004511632 
 ・・・ 
 +OK 1827/512KRequest:unix/999166513.243075LastModify:1004504560 
 ・・・ 
 +OK 0/512KRequest:win/1003508243.184355LastModify:1004024020 
 +OK 2900/512KRequest:win/1004351681.49566LastModify:1004511770 
 ・・・ 
 +OK 7808/512KRequest:software/1004096526.38369LastModify:1004511760 
 ・・・ 
  
 なんかまずい点とかあったら指摘お願い。 
 
- 111 :デフォルトの名無しさん :01/10/31 17:43
 -  一応commitした。 
 おかしい所やバグなどがあったら、直してくださいな。 
 
- 112 :デフォルトの名無しさん :01/10/31 17:51
 -  今度同鯖を巡回するクライアントはマルチリクエストを 
 使用することが推奨される…と。 
 
- 113 :デフォルトの名無しさん :01/10/31 18:16
 -  >>108 
 1) : いちいちチェックするコストがもったいない(接続要求は腐る程ある). 
 2) : 最初の1回は META を読むために HTML の転送が発生してしまう. 
 3) : せっかくきれいな PATH_INFO url が汚くなる(私見). 
  
 って感じなので robots.txt がコスト的にも一番良いと思う. 
 
- 114 :デフォルトの名無しさん :01/10/31 18:29
 -  http://<鯖名>.2ch.net/robot.txt を作って 
  
 User-agent: * 
 Disallow: /test/ 
  
 って書いて、 read.cgi は巡回されずに過去ログはいままでどおり 
 巡回してくれるってのがいいな。 
 
- 115 :名無しさん :01/10/31 19:50
 -  PATH_INFOをやめて元に戻すのが一番スマートな解のような 
 
- 116 :デフォルトの名無しさん :01/10/31 19:55
 -  robots.txtのほうがスマートだと思うな。 
 どっちにしろロボットは必ずrobots.txtを一発取りに来るし 
 過去ログとかも同様に制限できるしね。 
 
- 117 :デフォルトの名無しさん :01/10/31 20:56
 -  Disallow: /test/read.cgi/tech/*/ 
 みたいな指定はできないんですか? 
 
- 118 :デフォルトの名無しさん :01/10/31 22:42
 -  できると思うけど /test/ でいいんじゃない? 
 全板まとめて規制できるし。 
 
- 119 :デフォルトの名無しさん :01/11/01 02:33
 -  http://pc.2ch.net/test/read.cgi/tech/100282090 
 みたいな間違ったリクエストをした時でも、ステータスは 
 200 OKが返っていますけど、これは、404 Not Foundを返すようにした方がいいんじゃありません? 
 
- 120 :一スレ800件!! :01/11/01 05:47
 -  ちょっとこれを見てやって下さいよ。 
 ttp://www.google.com/search?num=100&q=read.cgi+%89%FC%97%C7%83X%83%8C%83b%83h+site%3Apiza2.2ch.net 
 ここまでくると、検索エンジン荒しと見紛う勢いです。。。 
 
- 121 :120 :01/11/01 05:48
 -  しかも全て準デッドリンクだし。。。。 
 
- 122 :デフォルトの名無しさん :01/11/01 10:11
 -  >>119 
 無意味にキャッシュが効かなくなるだけ。何がいいのかわからん。 
 
- 123 :名無しさん :01/11/01 15:28
 -  >>120 
 ワロタ 
 
- 124 :デフォルトの名無しさん :01/11/01 15:31
 -  site:を付けずに検索すればちゃんとまとまるじゃん。 
 http://www.google.com/search?num=100&hl=ja&q=read.cgi+%89%FC%97%C7%83X%83%8C%83b%83h&lr= 
 
- 125 :デフォルトの名無しさん :01/11/01 16:43
 -  >>124 カキコの趣旨が違うと思う。 
 移転してもうないにもかかわらず、一つのスレに対して800件もヒットさせてしまう, 
 悲惨なGooglebotを晒し上げているのでしょう。 
 
- 126 :デフォルトの名無しさん :01/11/01 16:51
 -  得意げな顔して何が、800件ヒットしました、だ。 
 お前は本当にキャッシュを更新してるのかと問いたい。問い詰めたい。小1時間問い詰めたい。 
 お前、個人情報を晒しあげたいだけちゃうんかと。 
 検索ロボット通の俺から言わせてもらえば今、検索ロボット通の間での最新流行はやっぱり、 
 http://web.archive.org/、これだね。 
 http://web.archive.org/*/にURLを追加。これが通の検索の仕方。 
 http://web.archive.org/ってのは昔のコンテンツが多めに入ってる。そん代わり著作権への配慮が少なめ。これ。 
 で、それにNOARCHIVEタグ無視。これ最強。 
 しかしこれを晒すと次から自分のページも晒し上げられるという危険も伴う、諸刃の剣。 
 素人にはお薦め出来ない。 
 まあお前、夜勤 ★は、robots.txtでも置いてなさいってこった。 
 
- 127 :デフォルトの名無しさん :01/11/02 12:48
 -  >>126 
 ハゲシクワラタ 
 
- 128 :名無しさん :01/11/03 02:07
 -  robots.txtを無視するエンジンもあるってきいたことあるけどどうなんだろ 
 
- 129 :デフォルトの名無しさん :01/11/03 02:08
 -  あの激戦の名残がまだ残っていたとは… 
 正直、あの時は感動した。 
 
- 130 :デフォルトの名無しさん :01/11/03 02:20
 -  >>128 そういう非常識なロボットには2chボムをくらって貰いましょう。 
 一つのスレで800件のヒット。。。 
 
- 131 :名無しさん :01/11/03 02:21
 -  2chが食らってるんでしょ?転送量でいうと 
 
- 132 :デフォルトの名無しさん :01/11/03 02:26
 -  2ch全体の転送量から見てどうなんでしょうね? 
 何万サイトからのロボットが走りまわっているわけでもないでしょうから。。 
 
- 133 :デフォルトの名無しさん :01/11/03 17:23
 -  どっちににしろ&ls=50とかの形式にもどせばいいだけだとおもうけど 
 
- 134 :デフォルトの名無しさん :01/11/03 17:46
 -  >>128 
 robots.txtを見ないロボットがあっても、それがメジャーなところでなければ 
 問題ないよね。問題になりそうなところって具体的にどこがあるか 
 知ってる人いる? 
  
 >>133 
 それだとそれ自体の転送量が増える。 
 (PATH形式にしたのは転送量を減らすためだし) 
 robots.txtを置けば解決するってことで終了してるんじゃないの? 
 
- 135 :read.cgi ver4.1 :01/11/09 21:19
 -  printf("\t\t\b\b\t\t\b\b"); 
 
- 136 :デフォルトの名無しさん :01/11/09 23:48
 -  monazilla BBS で,ここで作ってる新 read.cgi の仕様欲しがってる開発者が結構いるみたい. 
 洩れは新 cgi の機能や実装の根拠が分からんので手がでそうに無いけど, 
 分かる人がまとめてあげると良いと思いますがどうでしょう. 
 ツール開発者に新仕様の効果的な使い方を啓蒙することも転送量削減につながるんじゃないかと. 
  
 # 自分は仕様を把握してないんで sage 
 
- 137 :デフォルトの名無しさん :01/11/10 00:07
 -  旧形式で呼ばれたときに 
 >>nn 
 の処理がおかしいようです。 
  
 read.cgi ver5.27 
  
 http://game.2ch.net/test/read.cgi/gameover/1003130793/43 
 http://game.2ch.net/test/read.cgi?bbs=gameover&key=1003130793&st=43&to=43&nofirst=true 
 
- 138 :デフォルトの名無しさん :01/11/10 00:09
 -  >>137 
 どうおかしいんですか? 
 新形式になってることぐらいしか気づきませんが… 
 
- 139 :デフォルトの名無しさん :01/11/10 00:13
 -  >>136 
 rawの挙動についてまとめればいいんすかね? 
 
- 140 :デフォルトの名無しさん :01/11/10 00:14
 -  >>138 
 リンク先に飛んで見てください。 
  
 http://game.2ch.net/test/read.cgi/gameover/1003130793/43 
 では 
 >>23はhttp://game.2ch.net/test/read.cgi/gameover/1003130793/23 
 になります 
  
 http://game.2ch.net/test/read.cgi?bbs=gameover&key=1003130793&st=43&to=43&nofirst=true 
 の形式で呼ばれた場合 
 >>23は 
 http://game.2ch.net/test/23 
 になります。 
 
- 141 :デフォルトの名無しさん :01/11/10 00:15
 -  >>140 
 どっちも正常ですが… 
 
- 142 :デフォルトの名無しさん :01/11/10 00:17
 -  >>140 
 もしかしてbaseタフグ解釈しないブラウザ? 
 うちはちゃんと見えるよ。(IE5.5) 
 
152KB
新着レスの表示
スレッドリストへ戻る 全部 前100 次100 最新50
0ch BBS 2004-10-30