【Xflops-HPC Start Guide】信息素养
新学期即将来临,Xflops超算队招新以及超算校内赛正在火热筹备中。作为Xflops超算队的一员,我与其他成员将共同负责HPC入门指南的修订与编写。Xflops超算队的HPC入门指南系列文章旨在帮助新成员快速入门和了解HPC知识,为校内赛的参赛者提供必要的知识储备和技能指导。本文是该系列的第一篇,对往年版本进行了更新与修订,主要介绍信息素养的重要性以及如何有效获取和使用信息。
如何高效获取信息
信息素养是什么
信息素养(Information
Literacy)是指个体在信息社会中所具备的获取、评估、组织、利用和创造信息的综合能力,它是数字化时代每个人不可或缺的核心素养之一,其内涵不仅包括对信息工具和技术的操作能力,更强调对信息的批判性思维和伦理意识。然而,由于我国教育的局限性,绝大部分的高中生长期处于与外部社会相对隔绝的信息环境,在信息素养方面的认知和实践都相对薄弱,对于如何正确的获取和使用信息缺乏认知和经验。本文假设读者初次使用互联网,旨在提供一些具体指导,帮助读者高效获取信息并做出明智的判断。
信息从哪来?
按照信息密度从高到低,可以将今天互联网的第一手信息来源大致分为以下几类:
- 高密度:学术文献和数据库,政府和专业机构发表物,行业报告和白皮书,课程和书籍
- 中密度:专业新闻媒体,百科,博客和个人网站,技术文档
- 低密度:社交媒体,问答平台,(短)视频平台,即时通讯应用
高密度信源通常意味着较高的阅读门槛和时间投入,适合深入理解特定领域的内容;相反,低密度信源则门槛较低,更适合获取快速和浅显的信息。
作出这些区分的目的并不是希望塑造一种信息的等级制,而是希望明确,当大家对于信息有不同程度的需求时,应该从何处下手。
例如:
- 如果你希望实时跟进某个领域的最新进程,而不需要对它有深入的理解,可以考虑关注特定的自媒体/公众号/前沿推送。
- 如果需要快速解决某个技术问题(bug报错,编程工具快速入门),则博客和技术文档是最佳的选择。
- 如果希望对某个具体问题有深入透彻的理解,才需要深入挖掘文献和书籍。
信息的门户
正如ChatGPT所说,信息的获取始于需求。当你意识到自己需要某方面的信息以解决问题时,便需要某种媒介,从海量信息中筛选出有用的部分。
下面三个章节将介绍三种形式的媒介:向他人求助,搜索引擎,AI大语言模型。
推荐阅读:
- 尝试梳理你对信息的需求,以及你日常生活中摄取新信息的途径和内容。
- 了解’信息茧房’和’推荐算法’的概念和关联,试作思考和评论。
- (选做)选取一个对你来说陌生但是感兴趣的概念,尝试在两个小时内获得尽可能全面深入的理解。可以从基本原理,应用场景,发展脉络,未来方向等方面入手。
- 参考词:深度学习,函数式编程,风险投资,量子计算,GPU,排队论···
如何向他人求助
当你无法通过自助手段解决问题时,向他人求助是一个好选择。使用合适的方式提问可以节省各方的时间并且提高解决问题的可能性。以下是有效提问的关键要素:
- 没有笨的问题:任何问题都有被提出的价值,把问题憋在心里只是阻碍自己的进步。
- 描述清晰:清楚地描述你的问题背景,你尝试过的解决方法和你当前的困惑。问题要具体,避免笼统或含糊不清的描述。
- 选择合适的被提问方:在多数情况下,他人没有义务或能力解答你。
- 尊重他人时间:理解他人可能有自己的工作安排,礼貌提问,耐心等待回复。
这里单列一节的原因是网络社区中通常充斥着不少低质量的求助提问,这在拉低讨论质量的同时引起社区的普遍反感。请务必在提问前充分理解这一节的精神。
推荐阅读:
- 回忆你上一次编程/学习时遇到的困难,尝试写出一个清晰的问题描述。
- 包括问题背景,尝试过的解决方法,当前的困惑等。
- 如果你不确定问题是否清晰,可以请教身边的人。
- 阅读以下提问示例,并指出其中的优缺点。
- 示例1:“我在使用C++ vector时遇到了问题. 它没有正常工作. 有人能帮我吗?”
- 示例2:“我正在进行一个C++项目,并使用标准模板库中的vector类。我尝试使用at()方法访问元素,但一直得到out_of_range异常。以下是我的代码片段:pastebin链接”
如何使用搜索引擎
以下是一些通常的步骤和技巧,有助于使用搜索引擎。
- 使用正确的语言搜索
- 技术性内容建议使用英文关键词。
- 只有涉及中文世界独有内容时建议使用中文搜索。
- 选择合适的搜索引擎:
- 建议使用 Google,Bing。
- 注意区分浏览器与搜索引擎的区别。
- 由于国内存在APP信息孤岛,部分信息也建议在B站,小红书,知乎等网站内直接搜索。
- 建议使用 Google,Bing。
- 输入关键词:
- 尽量使用简洁且具体的关键词,
- 避免输入太笼统或太长的句子。
- 使用高级搜索
- 评估搜索结果:
AI的使用
近年来,人工智能领域蓬勃发展,AI大语言模型已深度融入我们生活的方方面面。简单来讲,大语言模型通过对海量文本数据的学习训练,具备理解和生成类人自然语言的能力。这类模型可与人类对话交流、答疑解惑、提供建议,甚至进行内容创作。当下,围绕大语言模型(LLM)的应用丰富多样,下面为大家作初步介绍,助您快速入门。
基础大模型
基础大模型分为闭源和开源两种类型,通常每家公司都有部分模型开源,部分模型闭源。
- 闭源模型,用户只能借助平台提供的接口访问,无法知晓模型的全部细节。
- 开源模型则是指模型的权重和架构完全公开。使用这类模型,既可以通过公开的AI聊天平台,也能在自己的计算设备上进行部署,还可通过模型构建方提供的界面(若有)来操作。
不同模型在语言能力、推理能力、知识储备丰富度、编程能力等方面存在差异。您可以多进行尝试以找到最适合您的模型,同时可参考AI排行榜。
但是,AI的回答并非绝对正确的!在使用AI的过程中,请务必注意大模型的回答中是否存在错误,务必对结果加以检验。
尽管大模型功能强大,但要想获得高质量回答,需掌握合适的提问方式。通过精心调整提问语句(prompt,提示词)来优化大模型回答的技术,被称为提示工程(prompt engineering)。若大模型的回答不尽人意,不妨深入了解相关内容。
大模型平台
大模型平台是指提供大语言模型服务的在线平台,用户可以通过这些平台访问和使用各种大语言模型。平台通常提供了友好的用户界面,方便用户与模型进行交互。下面给出一些常见的大模型平台:
国外平台
- ChatGPT :OpenAI公司的ChatGPT,在自然语言处理领域表现卓越,具有出色的对话理解与生成能力。
- Gemini :Google Gemini,谷歌推出的大语言模型,在语义理解、知识应用等方面展现出强大实力。
- Claude :Anthropic公司的Claude AI,在多轮对话、复杂任务处理方面有良好表现。
- Llama :Meta公司的llama模型,开源且性能优秀,为众多开发者提供了模型基础。
- HuggingFace :HuggingFace,全球最大的AI开源社区,汇聚了丰富的模型资源与开发工具。
- Ollama :ollama,可用于在本地部署开源大模型的框架,方便用户在自有环境中使用模型。
国内平台
- DeepSeek :DeepSeek,在多模态融合、专业领域知识问答上具备优势。
- 豆包 :字节跳动的豆包智能体平台,功能丰富,能满足多种场景下的交互需求。
- Kimi :月之暗面Kimi Chat,具有独特的交互设计与个性化服务能力。
- 通义千问 :阿里巴巴的通义千问,在电商、办公等领域能提供贴合实际需求的服务。
- 智谱ChatGLM :智谱ChatGLM,在中文语言理解与生成上进行了针对性优化。
- 文心一言 :百度的文心一言,整合百度丰富的知识图谱与数据资源,为用户提供全面服务。
校内平台
- DeepSeek本地版 :由Xflops超算队协助上海交通大学网络信息中心部署的本地DeepSeek模型,支持DeepSeek、QWen等模型,可以在DeepSeek官方平台“服务器繁忙”时解决你的燃眉之急。
- AI应用平台 :上海交通大学的AI应用平台,集成了多种AI工具与服务。
AI应用
这里我们将大致列举各类基于大模型构建的AI应用,重点关注能助力日常工作与生活的应用。上文提到的大模型平台也自带一些实用工具,大家可自行探索。
AI编程助手
- Github Copilot :Github Copilot,学生可免费使用,强烈推荐。它能在编程过程中实时提供代码建议,大幅提升编程效率。
AI搜索
AI智能体
- Poe :AI聊天平台,集成了众多开源与闭源模型及智能体,用户可按需选择使用。
AI生成
MCP服务
- 试用2~3款大模型。
- 向大模型或者聊天智能体提问农夫过河问题,如“一个农夫需要将狼、羊、狐狸、鸡和米五种物品运送过河,每次只能带两件,且狼和羊/狐狸和鸡/鸡和米不能单独相处,每次运送时农夫必须在船上,最少需要过河几次?”,测试模型的推理能力。
- 分别通过搜索和向AI提问,了解思维链(Chain-of-Thought),RAG(Retrieval Augmented Generation),多模态(Multimodal)等大模型相关概念,对比两类信息获取方法的优劣,对比使用中英文提问的差异。
- (选做)让AI使用你熟悉的编程语言编写程序,在仅通过调整prompt,不手动修改AI输出的代码的条件下,让AI生成可以完美运行的程序。例如:用C++编写2048游戏。
- (选做)让AI回答入门文档中其他章节的练习题。
信息安全意识
在使用互联网时,信息安全意识至关重要,因为网络攻击,数据泄露和隐私侵害随时可能发生。为了保护个人信息和数据安全,以下是一些基本的安全意识和实践建议:
- 使用强密码:
- 启用双因素认证(2FA):
- 在支持的服务上启用双因素认证,增加账户安全性,如Github、Google等。
- 注意钓鱼攻击:
- 不要轻易点击不明链接或下载未知附件。
- 验证发件人身份,尤其是涉及敏感信息或财务交易时。
- 在交大,如果收到不以“@sjtu.edu.cn”结尾的邮件,内容是“财务报表”、“奖学金异常”、“账户异常”等的邮件,请务必不要点击链接或下载附件(哪怕是以“@sjtu.edu.cn”结尾的邮件也要谨慎对待),“你也不想让这些数字因你而归零吧”.jpg
- 妥善保管Jaccount账号与密码:
- 对于交大学生,Jaccount账号是你在校期间的最重要的身份标识,务必妥善保管。
- 不要将Jaccount账号和密码告诉他人,尤其是陌生人。
- 如果怀疑账号被盗,请立即修改密码并联系学校信息中心。
- 定期备份数据:
- 定期备份重要数据到外部存储设备或云存储服务
- 使用安全的网络连接:
- 避免在公共Wi-Fi网络上进行敏感操作,如网上银行或购物。
- 不要连接不明的Wi-Fi热点,尤其是没有密码保护的网络。
- 保持软件更新:
- 定期更新操作系统、应用程序和防病毒软件,以修补已知的安全漏洞。
- 启用自动更新功能,确保软件始终处于最新状态。
- 警惕不明U盘:
- 不要随意插入不明来源的U盘或其他外部存储设备,这可能会导致恶意软件感染。
- 了解隐私设置:
- 在社交媒体和在线服务中,了解并调整隐私设置,控制个人信息的公开程度。
- 定期检查应用权限,确保只授予必要的权限。
实际上,信息安全意识远远不是三言两语能说清楚的,其养成需要长期的学习和实践。以下是一些推荐的资源和文章,帮助你更深入地了解信息安全和隐私保护。
- 如何安全上网避免隐私泄露
- 知乎:如何在互联网上尽可能的保护自己的隐私
- 从“我”开始的安全指南
- 上网和设备安全的建议,适于对安全有较高追求的读者
- 数据管理的建议