統一された基準は重要です(xlog のリンク参照形式のテスト)
2024-04-10、午後 2 時から 4 時 5 分まで、2 時間かかりましたが、ついに PyHanLP を正常に実行できるようになりました!以下に学んだ知識を記録します👇
卒業設計の一環として、非構造化の情報をテキストから抽出する必要があり、意味を理解するツールが必要でしたので、今日は Python に PyHanLP をインストールしました。
以下に私が遭遇した問題を共有します。時間があれば、HanLP について説明しますが、時間がなければ無視します。
この記事では、実際の経験を通じて、欠落した概念が仕事をより複雑にする可能性があることを証明します!もし私がこの概念を重視し、その影響を理解していたら、おそらく Python の仮想環境を専門とする Conde を学ぶことを選ぶでしょうし、HanLP というサードパーティライブラリをダウンロードするでしょう。
HanLP の簡単なインストールの注意事項#
私は公式ウェブサイトの簡単なインストールパッケージを使用しましたが、この簡単なインストールパッケージは私を本当に馬鹿にしていました。インストールディレクトリを選択することさえ許してくれず、Java 環境、HanLP、そして新しい Python 3.8 を一括でインストールしてしまいました!
しかも、これらのものはすべて C ドライブにインストールされました!
元々の Python 3.12 では PyHanLP を呼び出すことができず、PyHanLP は傻瓜インストールされた Python 3.8 からのみ呼び出すことができました。
この問題を解決するために、プロジェクトの仮想環境の Python 3.12 を Python 3.8 に変更しようとしましたが、変更後に書いたコードは機能しませんでした - それは Python 3.8 にこれらのライブラリがインストールされていないためです。
私はこれで理解しました、仮想環境の Python バージョンも指定されていることを。仮想環境でインタプリタを Python 3.8 に変更しても、仮想環境にインストールされた Python 3.12 の pip ライブラリを使用することはできません。なぜなら、これらのライブラリは Python 3.12 のみを認識するからです!ですので、新しい仮想環境を作成する必要があります。
その後、新しい仮想環境を作成し、Python 3.8 を呼び出し、以前のコードをすべてコピーし、必要なサードパーティライブラリを再度ダウンロードしましたが、問題は再び私の前に現れました。
PyHanLP を実行しようとすると、ターミナルでライブラリが見つからないというエラーが表示されます。私は再び理解しました、PyHanLP はグローバル環境のライブラリであり、仮想環境からは呼び出すことができません。
しかし、問題は、仮想環境のターミナルで pip install pyhanlp
を使用しても、それをダウンロードすることができないことです。ですので、私は傻瓜インストールパッケージを使用して PyHanLP をインストールするしかありませんでした。つまり、仮想環境で PyHanLP を使用することはできません。私は C ドライブの Python 3.8 を使用し、ライブラリをすべて C ドライブにインストールするしかありません!
この問題を解決するために、仮想環境を使用するのを諦め、直接グローバル環境を使用する必要があります。Python 3.8 をコンピュータの環境変数に追加し、Python 3.8 の優先度を Python 3.12 よりも高くする必要があります。これにより、ターミナルで使用する pip install
コマンドは Python 3.8 を対象とします。
仮想環境の場合、インストールしたすべてのライブラリは、コードが存在するフォルダにインストールされます - 私はもちろん C ドライブには置きません。
これらの障害が一つずつ私に理解させ、仮想環境の真の意味を理解させました - 独自の pip ライブラリを持ち、他の Python インタプリタとは独立した作業環境を持つこと!
私の C ドライブはさらに多くのライブラリをダウンロードすることになりますが、元々メモリが少ないです。これはすべて、仮想環境で PyHanLP をインストールできなかったためです!そして、以前は「仮想環境」を理解していなかったためです。
私はまだ初心者ですが、少なくとも今日の経験からいくつかのアドバイスを提供できるかもしれません。
Python の初心者の場合:多くの Python サードパーティライブラリをダウンロードし、Python を使用して作業を頻繁に行い、C ドライブに負担をかけたくない場合(他のドライブに保存したい場合)、Conde を正直にダウンロードしてください(Conde は Python ライブラリを管理し、仮想環境を作成するためのプラットフォームです)。
HanLP ライブラリを使用したい場合、公式ウェブサイトでは conda のダウンロード方法も提供されており、2 行のコードでインストールできます(傻瓜インストールパッケージよりも複雑ではありません)。そして、conda でインストールパスを設定しておけば、conda がインストールする PyHanLP は C ドライブに傻傻にインストールされないと思います!
仮想環境とは何ですか#
簡単に言えば、仮想環境とは、特定のバージョンの Python と独自の pip ライブラリを使用することです。
- 仮想環境は、新しい Python をインストールしたのと同じようなものですが、実際には新しい Python をインストールするわけではありません。仮想環境を作成すると、大量のメモリを使用しません。
- プロジェクトが仮想環境でアクティブになっている場合、その環境でインストールされた Python ライブラリのみを使用できます。元の Python に多くのライブラリがあっても、仮想環境の Python からはそれらを呼び出すことはできません。
- 仮想環境は、プロジェクトごとに必要なライブラリと他のプロジェクトのライブラリを区別し、各プロジェクトファイルにとってスペースを節約するために使用されます。
VSCode で仮想環境を作成する方法#
VSCode でプロジェクトに専用の Python 仮想環境を作成する方法:
- VSCode を開き、フォルダを開きます
- VSCode の右下にある Python エディタをクリックし、表示されるオプションから「仮想環境の作成」を選択し、作成する仮想環境と使用する Python のバージョンを選択します
- 新しいターミナルを作成し、ターミナルに
. \ venv \ Scripts \ activate
と入力して仮想環境をアクティブにします。これは、ターミナルをこのディレクトリに移動させるだけです。注意すべきは、次回 VSCode でこのフォルダを開く際には、仮想環境をアクティブにする必要がないことです。ソフトウェアが自動的に入ります。
この問題の結末#
私は Conde をダウンロードして HanLP を再インストールするつもりはありませんが、C ドライブに設定されたすべてのものをこの傻瓜インストールパッケージを使用して使用するつもりもありません。
Conde の使用方法を学ぶ時間がもうありません。それは英語のインターフェースであるだけでなく、私にとっては半日の時間も非常に貴重です。私にはやることがたくさんあります。
大学院に合格した後、この素晴らしいツールをしっかりと操作するつもりです!今は妥協せざるを得ません、C ドライブで卒業設計を完成させます。