IT雑談

IT 雑談 chat technology

3a1899c8 anonymous 2018-05-28 08:29
>>48d72fa8
コーパス作りたいなら形態素解析してあとは好きな辞書形式に変換するスクリプト書いて
9d50e1c7 anonymous 2018-05-28 14:34
>>3a1899c8
その形態素解析のロジックが知りたい
d834466b anonymous [yuuki] tR4gyrKdBJO 2018-05-28 23:39
>>9d50e1c7
形態素解析ライブラリのドキュメントを見れば、どんなアルゴリズムを使ってるかわかると思うが
53c9a4de anonymous 2018-05-29 10:39
> 形態素解析のロジック
形態素解析から自分でやりたいってこと?形態素解析ライブラリの使い方が知りたいってこと?
いずれにせよググれば出てくる
前者なら図書館で自然言語処理の本探したほうが良いかもしれんが
eb2949b9 anonymous 2018-05-29 22:01
>>53c9a4de
形態素解析から自分でやろうと思ってたんだけど
フリーで使えるやつとかソース公開されてるやつ使ってみて調べてみることにするわ
91c8777f anonymous 2018-05-30 10:39
2chのログから形態素解析でコーパス作成って、順番が逆では?
未知語まみれの文章を突っ込んでも出鱈目な結果しか出ないでしょ
7fdcde61 anonymous 2018-05-30 17:08
>>91c8777f
最初はメカブを使って形態素解析をして2ch語辞書を作ろうと思ったんだけど
→メカブは辞書が一般だから形態素解析できないんじゃね?
→じゃあ頻出する文字パターンを辞書登録するスクリプトを書こう
→あれこのスクリプト簡単じゃないぞ
>>48d72fa8
という流れなんだがなんか無限ループしそうで笑
44d2e3b4 anonymous 2018-05-30 22:01
>>7fdcde61
> →じゃあ頻出する文字パターンを辞書登録するスクリプトを書こう
MeCabの作者さんがそれもやってる
http://chasen.org/~taku/software/TinySegmenter/
6ff13d4b anonymous 2018-05-31 11:59
>>44d2e3b4
残念ながらそれは辞書が付いてる
7830bd0b anonymous 2018-05-31 13:14
一昨日から朔が急にエラー吐くようになって何事かと思ったらどうも8000番ポートで関係ないアドレスを受信してるっぽい
他に8000番使ってるアプリケーションなんかないはずなんだけどな…?怖い
4c8f2c11 anonymous 2018-05-31 18:11
>>7830bd0b
どんなエラーが出てるの?
4b42e2ff anonymous 2018-05-31 18:39
> TinySegmenterはコンパクトな設計にするために、辞書を使っていません

辞書に見えるあれは精度をよくするために頻度の高い単語を加重してるだけだと思うよ
さすがに文字種だけじゃ助詞とかの判別は厳しかろう
0f46f472 anonymous 2018-05-31 18:47
>>4c8f2c11
昨日出たのはこんなの([(伏)]は自分で伏せた部分)

2018-05-30 20:31:09<>Exception happened during processing of request from ('[アドレス(伏)]', [ポート(伏)])
2018-05-30 20:31:09<>Traceback (most recent call last):
2018-05-30 20:31:09<>  File "[path(伏)]\lib\socketserver.py", line 639, in process_request_thread
    self.finish_request(request, client_address)
2018-05-30 20:31:09<>  File "[path(伏)]\lib\socketserver.py", line 361, in finish_request
    self.RequestHandlerClass(request, client_address, self)
2018-05-30 20:31:09<>  File "[path(伏)]\lib\socketserver.py", line 696, in __init__
    self.handle()
2018-05-30 20:31:09<>  File "[path(伏)]\lib\http\server.py", line 418, in handle
    self.handle_one_request()
2018-05-30 20:31:09<>  File "[path(伏)]\lib\http\server.py", line 396, in handle_one_request
    if not self.parse_request():
2018-05-30 20:31:09<>  File "G:\saku-release-4.8.0\shingetsu\LightCGIHTTPServer.py", line 88, in parse_request
    found = re.search(r'^/+([?].*)?$', self.path)
2018-05-30 20:31:09<>AttributeError: 'HTTPRequestHandler' object has no attribute 'path'
3ea0f4ea anonymous 2018-05-31 21:40
invalidなHTTPリクエストを受信したときに発生するエラーだね
海外から変なリクエストが飛んでくるのはよくあることだし気にしなくていいと思う
011d7521 anonymous 2018-05-31 23:27
VPS借りたけど相変わらずリバースプロキシのやり方わからなくて自ドメインでsakuにアクセスできない
でもHSTS外したくないな
e8e97947 anonymous 2018-05-31 23:36
HSTSってSSLのレスポンスで返すんだからリバースプロキシの設定に関係なくないか
e4f7e314 anonymous 2018-06-01 14:03
LinePayは便利そう
個人間での送金でも使えるし、店への支払いにも使える
手数料は現金化する時だけ
似たようなサービスはドコモ口座とか、じぶん銀行があるけど、これは多分これは回線契約しないと使えなさそうだし
その点LinePayは回線契約の縛りはないから強いな
11713c52 anonymous 2018-06-01 14:16
>>e4f7e314
スマホないと使えないじゃん
しかもLINEとか嫌だし
ce46cd2b anonymous 2018-06-01 18:53
>>e4f7e314
ポイント還元率高いとき使ってたけどイマイチだよ

・Lineに銀行口座や個人情報を晒したくない
・晒さない場合チャージは現金のみ
・ポイントの還元率も改悪されてメリット皆無
・振込だけならネットバンクで十分(少なくとも俺の周りでは)
・店への支払いはクレカやICカードと手間が変わらないし使える店も変わらない
12e3178a anonymous 2018-06-01 18:54
>>e4f7e314
ポイント還元率高いとき使ってたけどイマイチだよ

・Lineに銀行口座や個人情報を晒したくない
・晒さない場合チャージは現金のみ
・ポイントの還元率も改悪されてメリット皆無
・振込だけならネットバンクで十分(少なくとも俺の周りでは)
・店への支払いはクレカやICカードと手間が変わらないし使える店も変わらない
b5a16405 anonymous 2018-06-01 21:02
LINEは韓国政府が監視を明言してるからな。
何故こんなにも無防備に政府の肝いりでNHKも使って普及させたのか謎。
dadf4750 anonymous 2018-06-01 23:29
それって結局ソースは週刊誌の記事ひとつで何の続報も無かったやつじゃん
セキュリティ体制とか色々と不安な会社ではあるが、そんな怪情報を持ち出してまで叩くほどのもんかね
4c60e266 anonymous 2018-06-01 23:34
怪情報w
アメリカでは監視されてるのは当たり前、韓国でも当たり前
それだけの極々当たり前の事実だよ
db09aed7 anonymous 2018-06-02 07:05
再配達依頼をサクッと出来る便利ツールなので使うよ
でもクレカ番号とかは入れたくないな
6828ac46 anonymous 2018-06-02 11:08
>>db09aed7
知らない間に、そんな事も出来るようになっていたのか・・・
あ、ラインペイはクレジットカードは無くても使えるよ
434ef2c3 anonymous 2018-06-02 21:10
>>4c60e266
最初からそうやって一般論を出しておけば火傷しない
後から偉そうにしたって、もう「週刊誌の与太を鵜呑みにしてた人」でしかない
d45689c1 anonymous 2018-06-02 21:46
急にどうした?週刊誌とか言いだしたのお前だけじゃね?
0a3d52c6 anonymous 2018-06-02 23:15
鍵屋で買えるやっすいWindows10/Officeって大丈夫なんだろうか
4bb3c7e7 anonymous 2018-06-03 00:46
そこら辺て売られているDVD-RにプリントされたWindows10/Officeが出てきたり
7643a2a0 anonymous 2018-06-03 18:12
>>d45689c1
いやだから、「韓国政府が監視を明言」ってFACTAが唯一のソースでしょ
それすら知らないのか
7d0bd988 anonymous 2018-06-03 18:28
用途がOfficeだけならOffice入りのタブレット+マウス・キーボード・モニタで良い気がする
4f8c83c6 anonymous 2018-06-04 12:37
理由もなく不正規の値段って時点で海賊版は確定だよね
MSのコントロールから外れてるってことだし
216dc564 anonymous 2018-06-04 18:32
海賊版というよりボリュームライセンスのキー(一回限り使用可能)の切り売りでは
9d7c386b anonymous 2018-06-04 21:35
>>b5a16405
> [データセキュリティ | LINE Corporation | セキュリティ&プライバシー](https://linecorp.com/ja/security/article/110)
>
> LINEは、ユーザ間のトーク内容に対して、通信経路で暗号化が施されています。また、ユーザ間トーク内容のうち、テキストメッセージ、位置情報、1対1のVoIPのメディアストリーム(音声とビデオ)は、LINE のLetter Sealing エンドツーエンド暗号化 (end-to-end encryption, E2EE)を用いて暗号化されています。Letter Sealing は、第三者のみならず当社のサーバー管理者であっても、通信上及びサーバー上でのメッセージ内容を閲覧することは出来ないことを保証します。
>
> 暗号化通信とLetter Sealing は、標準的な暗号化アルゴリズムを採用しています。

とあるから少なくともエンドツーエンドで標準的な暗号化はしてるんじゃないの?
これも嘘だから意味ないっていう極論出すなら個人間で暗号通信するしかないけど、必ずどっか間に通信業者が入るのだから自分で起業して安全性を担保するしかないような。そういうもんじゃないのかな詳しい人教えてほしい
8fa2dc07 anonymous 2018-06-04 22:52
>>9d7c386b
アメリカでプリズム事件とかあったのは知ってるよね
政府や軍が国内外の通信を盗聴するということは全然極論ではないよ
普通に現実的な話
これが極論だと感じるのは平和ボケした日本人だからだよ
アメリカでは結局盗聴は受け入れられた
国民がプライバシーよりもテロを未然に防ぐことの方が大事だと考えたからね
あと通信を個人で秘匿する技術としてはTorぐらいもう最近はネット使ってる人は知ってるのでは?
他にも色々あるよ
0f946d95 anonymous 2018-06-05 00:23
>>e4f7e314
ポイント還元率が高い時代は使ってたけど微妙だよ。
店への支払いはクレカやICカードと手間が変わらないし使える店も変わらない

あとLINEの秘匿性がどこまで信用できるかわからんけど、少なくともLINE Payをまともに利用するには
・携帯電話番号
・銀行口座、身分証明書
上の両方が必要になる。今Facebook登録している人も別途登録が必要。
そこまでして使いたいとは思わなかったし、ここまで必死に個人情報集められると気持ち悪い
e9626436 anonymous 2018-06-05 01:18
「政府による盗聴が現実的」なのは誰も否定してなくて、「LINEはどうか」っちゅう話しかしていないのでは
エンドツーエンドの暗号化ってどういう意味か分かってる?
盗聴できるような暗号化方式ならそうは呼べないよ

LINE社が嘘をついている、と主張するならまだ分かるんだけど
それ以外の場合には論理的に起こりえないものを「現実的」でごり押してもなー
1ee0f7be anonymous 2018-06-05 10:25
>>0f946d95
メッセージをE2Eにするのを知った時は、どうするのかと思ってたけど、金の流れを記録して金を産む準備をしてたんだな
f52059af anonymous 2018-06-05 12:19
> そこまでして使いたいとは思わなかったし、ここまで必死に個人情報集められると気持ち悪い

資金移動業は個人情報と取引を記録して不審なものを金融庁に報告する義務がある(資金洗浄対策)
個人情報出さずに同種のサービスを使いたいなら違法な業者しか選択肢に無くなるんでは……
977b2bdd anonymous 2018-06-05 13:56
>>e9626436
とりあえずプリズム事件を調べるのがいいと思うよ
そうすればLINEが嘘をついているというのは一々言わなくても共通理解になると分かるはず
マイクロソフトやGoogleが政府に協力して盗聴してますって公表してたか?
72908a51 anonymous 2018-06-05 20:04
エンドツーエンドの暗号化を本当にしてるかどうかはクライアントを調べれば判明するわけだから
サーバ側の情報を覗いてたPRISMとは様相が違うよ、って話なんだけど分からんかなあ
10ee3e10 anonymous 2018-06-05 21:26
>>f52059af
というよりはすでに浸透しきってる
クレジットカードやICカードがあるのにあえてLINE Payを使うメリットがないって話

個人情報についても金融庁への義務がどの程度のものかしらないけど、
先月までは個人情報登録なしで還元率2%以上でやってたサービスが
今月から急遽ポイント還元がほしい場合は、個人情報登録が必須要件になったんだから
法律的な理由じゃなくて個人情報が欲しくなっただけでしょ。
# 現に個人情報登録をしなくてもポイント還元を無視すれば今でも支払いに利用できるんだから
c08516c7 anonymous 2018-06-06 00:21
いまいち PRISM ググってもわかんねーな。エンドツーエンドで暗号化してるんだからクライアントのメモリー上を常に把握できる状態じゃないと監視できないんじゃないかな
復号されるタイミングはクライアント上でユーザーの目に見える段階なんだから、クライアントのメモリーを常に監視できるレベルでないと理論上無理だよな? 違うのかなー
そのレベルで監視できるなら tor だの pgp だの無意味じゃね。それとも AES とかを現実的に突破できる技術を持ってるってこと?
c096be7a anonymous 2018-06-06 00:27
あーエンドツーエンドで暗号化してるってのが嘘だっていう主張か
じゃあやっぱり企業のサービスを使うのをやめるしかないと思うな。インターネットを個人でやるしかない
680b4892 anonymous 2018-06-06 00:35
理想的にはオープンソースで実装されててそれがそのまま確実に配布されてるってこと証明できれば良いんだろうけど、攻撃者側も陥落が楽になっちゃうから難しいね
関係ないけど 100% バグがないって証明されたプログラムってあるんだろうか
34084010 anonymous 2018-06-06 00:37
仕様バグがないのも証明しなきゃいけないのか。やべーな
0a725285 anonymous 2018-06-06 00:58
チューリングマシンでしか動作しないプログラムに限るならバグがないことを証明することは不可能なはず
オープンソースが支持されてるのは攻撃態勢を具体的に評価できるからだしね
16f650d6 anonymous 2018-06-06 01:04
まちがえた
攻撃態勢→攻撃耐性
49b563e8 anonymous 2018-06-06 03:48
>>10ee3e10
そういえば、どうして今になってQRやバーコードなんだろうという気はする
バーコードリーダーはあっても磁気リーダーが無い昔の状態こそ真価を発揮するシステムなのに
クレカも磁気じゃなくてバーコードで良かったのに何故磁気にこだわったのか
今でも参入ハードルが低いという利点はあるけどね
4185a896 anonymous 2018-06-06 19:33
>>49b563e8
むしろ参入ハードルは磁気のほうがよっぽど高いかと
QRならスマホにアプリ入れるだけで十分だし。
そう考えると店舗側にはメリットがあるかもなぁ。

既存が磁気である理由はセキュリティとかあるんだろうけど一番は機器を売りたいメーカーの思惑じゃないかな。
そういう意味ではETCなんかも台湾やオーストラリアみたくタグで一発なのに、
利権団体を複数噛ませたいがためにあんな面倒で大げさな車載器を載せてるわけだし

Top of this page. | <<last <<new 0 1 2 3 old>> | Archive | Mobile

limit: 1536KB

IT 雑談 chat technology

(IT雑談/200/0.1MB)

Powered by shinGETsu.