关于小白玩AI,小白扫盲课,有些词你一定要知道!

AIGC项目教程2个月前更新 wanglu852
5,620 0 0
广告也精彩

1、常见的英文

虽然软件是中文的,但在使用的过程中还是有很多有必要知道的英文,先学习一下能让后面的过程更顺畅

1.ERROR

Error [‘erə] :错误。这是最重要的一个单词,必须记住这个单词!这个单词会在所有报错的时候出现,有了这个报错才知道什么原因,该怎么解决。它一般前面会跟有一个定语来修饰这个报错,后面跟着报错原因。比如:OutOfMEemoryError:CUDA out of memory。前面的OutOfMEemory说明问题是内存不足这类报错,后面的CUDA out of memory说明是显存不足。遇到问题就可以这样自己解决。问问题带上报错截图和网页截图。你当大佬给你算命呢,算命都要看手相,你手都不给人家看。

2.CUDA

这是N卡的统一计算架构,所有在N卡上进行的Ai计算都需要它。安装了显卡驱动的话都会安装上CUDA,CUDA也有不同的版本,建议手动下载11.8版本,新版有一些占用不满的问题。遇到一些CUDA报错那么一般都是显卡方面的报错。

3.GPU

GPU是图形处理器,显卡是GPU但GPU不一定是显卡。不是所有GPU都叫显卡!台式机的显卡是像一块砖一样,很大的一个硬件。笔记本只有那些昂贵且笨重的游戏本才有显卡。其他的GPU都是核显!核显不是显卡!

4.module

module: [ ‘mɔdju:l ]:模块。模块就是一个脚本,缺少某个脚本,对应的程序就无法运行。你可能会遇到No module的报错,遇到这种情况缺什么装什么就好了。比如:ModuleNotFoundError:No module named‘jieba_fast’,这里没有jieba_fast这个模块,那么只要python -m pip install jieba_fast装上这个模块就好了,缺什么装什么,你不用懂为什么要装,反正缺什么装什么就好了

5.WebUI

web是网络的意思,ui是使用界面的意思,合在一起就是一个网页,一个以网页呈现的操作页面。网页只是用来控制操作程序的,程序的运行并非是这么一个网页,真正的运行程序是你点开的那个go-webui.bat的程序

6.weights

weights [weɪts] :模型权重。也就是俗称的模型,GPT_weights就是GPT模型,SoVITS_weights就是SoVITS模型,以此类推就可以举一反三了,其他的模型只要找weights就行了。不过严格来说weights也不能算模型,weight指的是神经网络中的参数,这些参数被存储在称为“权重”的数组中,所以weights叫做模型权重。

7.output

output [‘aʊtpʊt] :输出。没啥好讲的,记住是输出的意思就好了。程序输出的文件一般都会在output文件夹,有的时候output会缩写成opt,比如uvr5_opt那么就代表这个文件夹是uvr5输出的文件的存放位置。

8.found

found [faʊnd] :找到。一般出现在路径不对的报错中,not found就是没有找到的意思。如果路径中没有某个需要的文件的时候就会报错NotFound:xxx。也有可能是没有找到某个模块,模块就是Module,ModuleNotFoundError。总之看见NotFound就去检查一下有没有缺文件,不要什么问题都干等着大佬来回答,这种低级的问题都能自己解决的。你哪怕去问别人,别人哪知道你的文件放在哪。

2、AI绘画黑话

咒语:指代提示词prompt
魔法师:指代写出提示词prompt的人
炼丹:指代训练练AI模型
炼丹炉:指代训练AI模型的地方
炼丹术士:指代训练AI模型的人
炸炉:指炼丹炼炸了,包括但不限于:CUDA OUT OF MEMORY、loss=nan、过拟合等

项目路径一律不许出现中文

本地部署的都是国外的东西,为了减少和避免BUG,项目存文件夹及文件夹内目录尽量用英文/拼音来命名。例如存放的stablediffusion的文件夹不能写AI绘画,可以用SD来代替。其它项目也需要注意。

3、什么是显卡

显卡指的是那些独立显卡,比如N卡、A卡、I卡,台式机的显卡是像一块砖一样,很大的一个硬件。笔记本只有那些昂贵且笨重的游戏本才有显卡。核显根本不算显卡!别再问核显能不能跑了,你那核显纸面数据再强,内存带宽也和显存差了好几倍。而且也没有CUDA。拥抱云端吧,简单快速方便便宜。
关于小白玩AI,小白扫盲课,有些词你一定要知道!

5.什么是显存

显存是显卡的专用内存,ctrl+shift+esc打开任务管理器看,专用GPU内存就是显存,其他的内存都是共享的,并不是真正的显存。

怎么查看自己的显卡和显存

关于小白玩AI,小白扫盲课,有些词你一定要知道!

4.什么是整合包

整合包是已经全部弄好解压即用的,如果你下的压缩文件是GPT-SoVITS-bate-main,那么你就下错了,那是源代码需要自己配置环境下载预训练模型,去下载整合包用。

5.什么是控制台

重点啊!重点!这个必须知道不然你使用过程就是盲人摸象,哪怕去问问题也没人回。
控制台就是这个你点了go-webui.bat后出现的黑底白字的框。上面是一条一条代码,虽然你看不懂,但这不重要,记得上面教的几个英文,能解决的就自己解决,不能解决的就带着控制台的完整截图和网页截图去群里问大佬。记得是完整截图,不要只截一个Error,你当大佬给你算卦呢。如果要给文件路径打码也不要打的太离谱把重要信息也遮住了。

6.什么是数据集

数据集是指一组数据样本,包含音频,文本等数据。数据集的质量指的是音频的质量和标注的正确率,数据集的大小指的是音频的长度。

7.什么是文件路径和文件夹路径

文件夹路径就是文件管理器上面这行,点一下就能复制了,他就像你家的门牌号。

文件路径是单独一个文件的路径,它更像一个坐标点。文件路径就是文件夹路径加上\文件名.后缀。一定要区分开文件夹路径和文件路径!看清楚要填的是什么!这种低级的问题你去问别人,别人都懒得回你……
关于小白玩AI,小白扫盲课,有些词你一定要知道!

8.什么是音频质量

1.响度

响度就是俗称的音量,常见的计数方式是dB,也就是分贝。生活中常见的分贝都为正数,比如60分贝是正常说话的声音。但dB作为一个对数单位他是不能直接拿来描述一个物理量的大小或多少的。在描述音频的音量时一般使用电平这个词,音频电平就是输入信号的电压大小,和人耳听见的分贝数是不同的。这部分比较晦涩难懂就不解释了,只要记住正常说话的电平要保持在-9dB~-6dB这个区间,在训练前用软件做下响度统一。听着感觉差距不大对吧。但因为db是一个对数单位。相差了3db那么就意味着相差10^{0.3}倍,大约2倍,如果相差10db就是10倍。越到后面差值越大,所以不要觉得大了几dB差距不大没关系。如果在正常电平下你觉得听起来声音小,那么是你的音响问题,请调整你的音响,不要乱动电平。
dB = 10lg\frac{P1}{P2}
关于小白玩AI,小白扫盲课,有些词你一定要知道!
这是同样一段音频不同响度在AU中的样子
关于小白玩AI,小白扫盲课,有些词你一定要知道!

2.混响

混响是后期反射声,你可以简单的理解为回声。你可能觉得正常录的声音能有什么回声,但实际上无论什么情况都会有混响,只是有大小和多少的区分罢了。最基础的看混响的方法是看频谱图,很明显第一张图就非常干净不拖沓。第二张图就是混响严重的。直接听下面的音频就是最好的对比。有混响的话就要用UVR5去混响,后面的教程里有讲。
关于小白玩AI,小白扫盲课,有些词你一定要知道!
关于小白玩AI,小白扫盲课,有些词你一定要知道!

3.音质

这里的音质是对音频准确性、保真度或清晰度的评估,不是hifi那种玄学的东西。一般情况下采样率,位深和码率都不会太低的。现在的麦克风都44.1k,16bit以上了。但清晰度这种东西就不好说了,你拿个几百块的耳机自带的麦克风那清晰度肯定差的不行,如果要自己录音的话最好买个单独的麦克风。再贵的耳机麦克风都不如一个独立麦克风。下面可以听一下清晰度的对比。当然清晰度也可以通过频谱图看出一点点。图一是音质好的,图二是音质差的。至于采样率,位深和码率不用太高的,会进行重采样的,Ai可不玩HiFi……
关于小白玩AI,小白扫盲课,有些词你一定要知道!
关于小白玩AI,小白扫盲课,有些词你一定要知道!

4.口齿清晰

就是人话:“口齿清晰”。不要求像播音员一样,但不要让人听着就感觉口水要喷出来了。中文的话比较难举例,我用一个英文举例。比如:fucking读成f——king。还有丁真那种像抽了20年烟一样的嗓子,恶心的要死的气泡音和塔菲那种夹子。正常说话就行了,别给Ai倒垃圾。

5.噪音

还是人话:“噪音”。录音的时候让家里的狗别叫了,音响别放音乐了,爸妈别吵架了,风扇空调关掉,门窗关好。AI无法分辨这些噪音和你说话的声音,别给Ai倒垃圾。

6.说话完整

还是人话:“说话完整”。每个字读完,中文还好但英文经常读一半,比如:fucking读成f——king。可能你说话会有口音那也不行,对于AI来说你说的话就是对牛弹琴。
持续更新中

© 版权声明
chatgpt4.0

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...
error: Content is protected !!