1.ssh安装 启动 远程连接
安装:sudo apt -y install openssh-server
查看是否开启:ps -e|grep ssh #sshd 表示server开启, ssh-client表示客户端开启
开启ssh: sudo /etc/init.d/ssh start
重启ssh: sudo /etc/init.d/ssh restart
远程连接:sudo ssh cb116@192.168.1.184
1)报错:WARNING: REMOTE HOST IDENTIFICATION HAS CHANGED!
原因:.ssh/known_hosts是记录远程主机的公钥的文件,之前重装系统,而保存的公钥还是未重装系统的系统公钥,在ssh链接的时候首先会验证公钥,如果公钥不对,那么就会报错。
方法:将known_hosts文件中的与登录错误的IP的公钥删除即可:ssh-keygen -f "/root/.ssh/known_hosts" -R "192.168.1.184"
2)报错:ssh: connect to host 192.168.1.184 port 22: Connection refused
原因:A想通过ssh连接B,而B未安装server
方法:在B上执行sudo apt -y install openssh-server
文件从服务器下载到本地:scp -r cb116@192.168.1.184:/disk2/wyl/test.txt /home/wyl
2.对进程、GPU进行监测和控制
(1)ps aux|grep python
ps aux输出格式:
USER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND
格式说明:
USER: 行程拥有者
PID: pid
%CPU: 占用的 CPU 使用率
%MEM: 占用的记忆体使用率
VSZ: 占用的虚拟记忆体大小
RSS: 占用的记忆体大小
TTY: 终端的次要装置号码 (minor device number of tty)
STAT: 该行程的状态,linux的进程有5种状态:
D 不可中断 uninterruptible sleep (usually IO)
R 运行 runnable (on run queue)
S 中断 sleeping
T 停止 traced or stopped
Z 僵死 a defunct (”zombie”) process
注: 其它状态还包括W(无驻留页), <(高优先级进程), N(低优先级进程), L(内存锁页).
START: 行程开始时间
TIME: 执行的时间
COMMAND:所执行的指令
(2)top
(3)nvidia-smi
GPU:GPU 编号;
Name:GPU 型号;
Persistence-M:持续模式的状态。持续模式虽然耗能大,但是在新的GPU应用启动时,花费的时间更少,这里显示的是off的状态;
Fan:风扇转速,从0到100%之间变动;
Temp:温度,单位是摄氏度;
Perf:性能状态,从P0到P12,P0表示最大性能,P12表示状态最小性能(即 GPU 未工作时为P0,达到最大工作限度时为P12)。
Pwr:Usage/Cap:能耗;
Memory Usage:显存使用率;
Bus-Id:涉及GPU总线的东西,domain:bus:device.function;
Disp.A:Display Active,表示GPU的显示是否初始化;
Volatile GPU-Util:浮动的GPU利用率;
Uncorr. ECC:Error Correcting Code,错误检查与纠正;
Compute M:compute mode,计算模式。
(4)nvidia-smi -L 用于列出所有可用的 NVIDIA 设备信息。
3.强制删除进程(进程号为pid):kill -s 9 pid
更新配置文件命令:source ~/.bashr #只更新当前终端上的配置
4查看python已安裝的包:python -m pip list
查看磁盘剩余空间:df -hl
改变文件(夹)权限:sudo chmod (-R) 777 文件(夹)名(每个人都有读和写以及执行的权限)
sudo chmod -(代表类型)×××(所有者)×××(组用户)×××(其他用户)
三位数的每一位都表示一个用户类型的权限设置。取值是0~7,即二进制的[000]~[111]。 这个三位的二进制数的每一位分别表示读、写、执行权限持续更新ing~~