【编程技术-免杀动态对抗之syscall[源码分析]】此文章归类为:编程技术。 基础概念 操作系统分为内核和应用层,从R0-R3,R0是内核,R3是用户层。windows中日常调用的api都是R3抽象出来的接口,虽然win32 api他也是R3接口,但是由于windows的设计思想就是高度封装,所以实际上的R3 api是ntdll.dll中的函数,过
原创 周杰伦 5个月前 阅读: 179 阅读时长: 9分钟
【音视频-Windows 下融合使用开源组件进行视频内容分析,shotcut ,autocut 剪辑 whisper智能化编辑双语字幕等】此文章归类为:[ "音视频", "whisper" ]。 文章大纲
原创 周杰伦 7个月前 阅读: 205 阅读时长: 2分钟
【语言模型-【论文综述+多模态】腾讯发布的多模态大语言模型(MM-LLM)综述(2024.02)】此文章归类为:["语言模型","人工智能","自然语言处理"]。 论文链接:24.02.MM-LLMs: Recent Advances in MultiModal Large Language | 国内-链接 实时网站:https://mm-llms.github.io 参考
原创 周杰伦 8个月前 阅读: 340 阅读时长: 9分钟
【人工智能-Whisper对于中文语音识别与转写中文文本优化的实践(Python3.10)】此文章归类为:["人工智能","whisper","语音识别"]。 阿里的FunAsr对Whisper中文领域的转写能力造成了一定的挑战,但实际上,Whisper的使用者完全可以针对中文的语音做一些优化的措施,换句话说,Whisper的“默认”形态可能在中文领域斗不过FunAs
原创 周杰伦 9个月前 阅读: 278 阅读时长: 9分钟
【论文阅读-【论文阅读】Speech Driven Video Editing via an Audio-Conditioned Diffusion Model】此文章归类为:["论文阅读"]。 DiffusionVideoEditing:基于音频条件扩散模型的语音驱动视频编辑 code:GitHub - DanBigioi/DiffusionVideoEditing: Official
原创 周杰伦 10个月前 阅读: 209 阅读时长: 9分钟
【whisper-whisper深入-语者分离】此文章归类为:["whisper"]。 文章目录 学习目标:如何使用whisper 学习内容一:whisper 转文字 1.1 使用whisper.load_model()方法下载,加载 1.2 使用实例对文件进行转录 1.3 实战
原创 周杰伦 11个月前 阅读: 141 阅读时长: 9分钟
【whisper-Amazon Toolkit — CodeWhisperer 使用】此文章归类为:["whisper"]。 tFragment--> 官网:https://aws.amazon.com/cn/codewhisperer/?trk=cndc-detail 最近学习了亚马逊云科技的 代码工具,感慨颇多。下面是安装 和使用的分享。 CodeWhisperer,亚马
原创 周杰伦 11个月前 阅读: 142 阅读时长: 8分钟
【笔记-挑战52天学小猪佩奇笔记--day21】此文章归类为:["笔记"]。 52天学完小猪佩奇--day21 【本文说明】 本文内容来源于对B站UP 脑洞部长 的系列视频 挑战52天背完小猪佩奇----day21 的视频内容总结,方便复习。强烈建议大家去关注一波UP,配合UP视频学习。 day21的主题:妈妈的生
原创 周杰伦 11个月前 阅读: 272 阅读时长: 9分钟
【whisper-Amazon CodeWhisperer 正式可用, 并面向个人开发者免费开放】此文章归类为:["whisper"]。 文章作者:深度-围观 北京——2023年4月18日,亚马逊云科技宣布,实时 AI 编程助手 Amazon CodeWhisperer 正式可用,同时推出的还有供所有开发人员免费使用的个人版(CodeWhisperer Individual)
原创 周杰伦 11个月前 阅读: 137 阅读时长: 9分钟
【音视频-AIGC: 关于ChatGPT中基于Whisper模型实现音频转文本】此文章归类为:["音视频","aigc","whisper","chatgpt"]。 概述 到目前,GPT只能去接收文本的输入,但是在现实的生活当中,会有语音的需求 GPT也有相关的能力接入,我们就需要一个能够将语音内容转换成文本的能力 当然其他第三方的软件或者接
原创 周杰伦 11个月前 阅读: 211 阅读时长: 7分钟