点评:从去年chatgpt 发布以来AI算法领域的技术与AI应用就特别的火,鹅厂的同学整理了一些资料,然后讲基本所需的知识点介绍了一些。尤其是机器学习(Machine Learning)&深度学习(Deep Learning)相关的。其中涉及了几个基础算法问题,如:贪心算法,马尔可夫决策过程算法,蒙特卡洛方法、强化学习方法,DQN等。文中提提供了一些参考资料介绍:感知机、神经网络、决策树、SVM、Adaboost到随机森林、Deep Learning等。机器学习(Machine Learning)&深度学习(Deep Learning)资料库 大概有七八百篇得资料,共大家一起学习参考. 以下是正文 最近因为 AI 大火,搞的我也对 AI 突然也很感兴趣,于是开启了 AI 的学习之旅。其实我也没学过机器学习,对 AI 基本上一窍不通,但是好在身处在这个信息爆炸的时代,去网上随便一搜发现大把的学习资料。像这个链接里面:https://github.com/ty4z2008/Qix/blob/master/dl.md 就有很多资料,但是这相当于大海捞针。在学习之前我们先明确自己的目的是什么,
目录SOLID 原则说明与感悟 前言 SOLID 设计模式的具体内容 SOLID 原则详解 一、单一职责原则 1、单一职责带来的好处 2、反规则的
原文地址:https://juejin.cn/post/7153906550505996296。是对《代码整洁知道-Clean Code》[美] Robert C.Martin 的总结。之前也看了这本书,大部分的书本内容都能完整的描述一个体系的内容,相对网上零碎的知识点来说,相对的信息量和完整度会更好。如果有好书建议好好拜读一下,完整的内容受益终身。 一句话总结很多观点都认为“开发业务没有技术含量,做架构才能体现技术价值”,这种观点有失偏颇。业务架构并不简单,只是很多开发同学理解简单了而已。业务架构讲究工程代码在迭代过程中能持续地应对杂、变等难题并保持程序员的生产力不下降。既然代码需要持续维护,那整洁的架构就非常有必要,本书从微观、宏观上介绍了保持架构整洁的一些方法。脑图详情第一章:整洁代码本章节是对全书的大概介绍,作者的核心观点是: 代码永远不可能被代替,因为编码过程就是把需求细节描述为机器可以理解的粒度。而这个过程中注定有些事情是无法抽象的 保持代码的整洁非常必要,这需要程序员自己亲自实践。不可能任何程序员看了此书后都会变成整洁代码大师 编码领域的规范:借用美国童子军军规——“让
本文转载自 知乎[苏一]的,《Word2Vec详解》 原文地址:https://zhuanlan.zhihu.com/p/61635013Word2vec是一种用于自然语言处理(NLP)的技术,于2013年发布。word2vec算法使用神经网络模型从大型文本语料库中学习单词关联。一旦经过训练,这样的模型就可以检测同义词或为部分句子建议额外的单词。目录一、Word2Vec概述二、Word2Vec原理三、CBOW四、Skip-gram五、Hierarchical Softmax六、Negative Sampling一、Word2Vec概述 Word2Vec是google在2013年推出的一个NLP工具,它的特点是能够将单词转化为向量来表示,这样词与词之间就可以定量的去度量他们之间的关系,挖掘词之间的联系。用词向量来表示词并不是Word2Vec的首创,在很久之前就出现了。最早的词向量采用One-Hot编码,又称为一位有效编码,每个词向量维度大小为整个词汇表的大小,对于每个具体的词汇表中的词,将对应的位置置为1。比如我们有下面的5个词组成的词汇表,采用One-Hot编码方式来表示词向量非常简
转载自 余欲与鱼语渔 的csdn 博客[推荐系统综述——附Xmind三分钟重点速览版] 编者注:推荐系统在产品的应用上十分广泛,再比如内容推荐、广告推荐、用户行为推荐、视频内容之类的推荐。都是用到了推荐系统相关的一些基本原理。推荐系统一般是结合着AB测试系统去上线或下架。一个推荐策略的一个优化 都是通过AB测试验证对应的效果后才会上线,并且推荐算法会经过不停的打磨调优。新的推荐算法和推荐策略 的迭代受限于本身产品的一个受众群体、产品调性、法律要求、道德水平等方面 1. 推荐系统概述 1.1 推荐系统是什么 推荐:根据用户的历史行为进行用户兴趣建模,结合内容的特征,给到用户最能满足其兴趣和需求的内容。 推荐系统:推荐系统是一种信息过滤系统,用于预测用户对物品的“评分”或“偏好”,是特定场景下人与信息更有效率的连接。 1.2 推荐系统意义 个性化推荐系统,主要是为了以下两点:解决信息过载问题;挖掘长尾物品/信息。 推荐系统通过发掘用户的行为,找到用户的个性化需求,从而将长尾物品准确推荐给需要它的用户,帮助用户找到他们感兴趣但很难发现的物品。 1.3 推荐系统工作步骤 推
背景硅谷的很多大型科技,比如:google、facebook、amazon 等,为了让代码的编码风格、代码质量更高,一般是有获得公司代码可读性认证(code-review-readability-certification)的人当作代码的审查者。Googler被要求较快地成为优秀的程序员,这是工作的基本要求。所以,Google的readability仅仅强调对某一门编程语言的设计理念、惯用法、细节代码最佳实践的熟练掌握。Readability训练营与认证在很大程度上考虑了DRY/SOLID/KISS等在代码设计原则与实现层面的应用。价值直接的价值就是:推进工程文化建设,个人工程师素养、公司组织管理、工具建设,是搞好现代化研发。宏观价值:提升团队、公司的整体技术水平,利于产品研发质量、对外开源建设的水平。个人价值:提升个人能水平,通过日复一日的高水平训练可以整体的架构设计能力、编码水平等。认证说明绿带(wet-hands)考试,是给大家一段400行左右的代码做code review。一般集中在一个地方,限时两个小时。考试给到的代码,可读性都非常差。正常情况,一般是指出核心设计问题,给出明
转载至 hugging face。原文地址 ,English version最近在研究 AI 在前端方面的应用,所以看到这个startCoder 库,github 地址是:https://github.com/bigcode-project/starcoder。这个库还有其他的方面应用,这里共享给大家。关于 BigCodeBigCode 是由 Hugging Face 和 ServiceNow 共同领导的开放式科学合作项目,该项目致力于开发负责任的代码大模型。StarCoder 简介StarCoder 和 StarCoderBase 是针对代码的大语言模型 (代码 LLM),模型基于 GitHub 上的许可数据训练而得,训练数据中包括 80 多种编程语言、Git 提交、GitHub 问题和 Jupyter notebook。与 LLaMA 类似,我们基于 1 万亿个词元训练了一个约 15B 参数的模型。此外,我们还针对一个 35B 词元的 Python 数据集对 StarCoderBase 模型进行了微调,从而获得了一个我们称之为 StarCoder 的新模型。我们发现 StarCod
文章小结这个是在qq音乐商业化团队在2021年3月份的总结文章。行文的内容有五个点:1、模块化(包含js模块化、CSS模块化),2、组件化3、规范化(包含代码规范、文档规范、流程规范)4、自动化:(包含构建编译、测试、CI/CD等)5、业务分析与改进。文章开头对简单工程化的生命周期划分我还是比较认同的,它包含了:项目的架构设计的初始化 -> 项目开发 --> 测试部署 --> 构建与部署 --> 运维管理。但实际文章中的内容来说的话,就是写的很细节,然后标题写的很大但是文中的内容就显得比较空。感悟我由于以前之前我在应用宝、微视、腾讯云都工作过,对腾讯内部MIG\PCG\CSIG各自体系的工具和系统都比较熟悉,然后作为面试官、参加各种行业内的大会,也了解了国内其他企业或公司内的系统大概情况。其实整个工程化来说是一个很大的课题,要想把整个项目或者是整个业务完全工程化的话,一个是费很大精力,二是要有一个全局的视角和思想来统领整个研发的投入。不过要对某一块业务或者是某一个系统做那个前端工程化的话,我可以给一些建议。【留个坑后面慢慢来补文章】这里先用 《前端工程化:体系
Chroma 是一个用于构建带有嵌入的 AI 应用程序的数据库。它内置了您入门所需的一切,并可在您的机器上运行,支持python 和 javascript版本。Chroma 为您提供以下工具:存储嵌入及其元数据嵌入文档和查询搜索嵌入色度优先:简单性和开发人员生产力搜索之上的分析它也恰好非常快Chroma 由Python客户端 SDK、JavaScript/TypeScript客户端 SDK 和服务器应用程序组成。查看Colab 演示。项目地址官方文档:https://docs.trychroma.com/github地址:https://github.com/chroma-core/chroma
概要说明格式说明有两类主要的音频文件格式:无损格式,例如WAV,FLAC,APE,ALAC,WavPack(WV)有损格式,例如MP3,AAC,Ogg Vorbis,Opus.序号类型说明1cdaCD音频格式扩展名2wav微软公司开发,用于保存WINDOWS平台的音频信息资源。3mp3全称MPEG:MovingPictureExpertsGroupAudioLayer-3,是目前用户最多的有损压缩数字音频格式。4aif/aiff苹果计算机公司开发的一种音频文件格式。5mid经常玩音乐的人使用,最大用处是在电脑作曲领域。6wma即Windows Media Audio,来自于微软。7ra主要适用于在网络上的在线音乐欣赏。8vqf雅马哈公司的一种声音格式,可以用雅马哈的播放器播放。9ape目前流行的数字音乐无损压缩音频文件。项目应用说明在视频编辑剪辑项目中主要使用:Mp3,AAC,Ogg,Wav, FlAC, APE等,如果前端无法识别需要服务端转码处理好后给前端一个规范的编码类型。不同类型在采集频率、编码方式、压缩率等都不太一样,另外在音频处理过程中还有增强、降噪、AI语音识别,网络与传
首乌
十年老程序员
粤ICP备2023052298号-1