非常想知道关河因果在医药领域是怎么做数据分析的?

从高的角度来看,统计学是一种利用数学理论来进行数据分析的技术。象柱状图这种基本的可视化形式,会给你更加全面的信息。但是,通过统计学我们可以以更富有信息驱动力和针对性的方式对数据进行操作。所涉及的数学理论帮助我们形成数据的具体结论,而不仅仅是猜测。

利用统计学,我们可以更深入、更细致地观察数据是如何进行精确组织的,并且基于这种组织结构,如何能够以最佳的形式来应用其它相关的技术以获取更多的信息。今天,我们来看看数据分析师需要掌握的5个基本的统计学概念,以及如何有效地进行应用。

特征统计可能是数据科学中最常用的统计学概念。它是你在研究数据集时经常使用的统计技术,包括偏差、方差、平均值、中位数、百分数等等。理解特征统计并且在代码中实现都是非常容易的。请看下图:

上图中,中间的直线表示数据的中位数。中位数用在平均值上,因为它对异常值更具有鲁棒性。第一个四分位数本质上是第二十五百分位数,即数据中的25%要低于该值。第三个四分位数是第七十五百分位数,即数据中的75%要低于该值。而最大值和最小值表示该数据范围的上下两端。

箱形图很好地说明了基本统计特征的作用:

  • 当箱形图很短时,就意味着很多数据点是相似的,因为很多值是在一个很小的范围内分布;

  • 当箱形图较高时,就意味着大部分的数据点之间的差异很大,因为这些值分布的很广;

  • 如果中位数接近了底部,那么大部分的数据具有较低的值。如果中位数比较接近顶部,那么大多数的数据具有更高的值。基本上,如果中位线不在框的中间,那么就表明了是偏斜数据;

  • 如果框上下两边的线很长表示数据具有很高的标准偏差和方差,意味着这些值被分散了,并且变化非常大。如果在框的一边有长线,另一边的不长,那么数据可能只在一个方向上变化很大;

我们可以将概率定义为一些事件将要发生的可能性大小,以百分数来表示。在数据科学领域中,这通常被量化到0到1的区间范围内,其中0表示事件确定不会发生,而1表示事件确定会发生。那么,概率分布就是表示所有可能值出现的几率的函数。请看下图:

常见的概率分布,均匀分布(上)、正态分布(中间)、泊松分布(下):

  • 均匀分布是其中最基本的概率分布方式。它有一个只出现在一定范围内的值,而在该范围之外的都是0。我们也可以把它考虑为是一个具有两个分类的变量:0或另一个值。分类变量可能具有除0之外的多个值,但我们仍然可以将其可视化为多个均匀分布的分段函数;

  • 正态分布,通常也称为高斯分布,具体是由它的平均值和标准偏差来定义的。平均值是在空间上来回变化位置进行分布的,而标准偏差控制着它的分布扩散范围。与其它的分布方式的主要区别在于,在所有方向上标准偏差是相同的。因此,通过高斯分布,我们知道数据集的平均值以及数据的扩散分布,即它在比较广的范围上扩展,还是主要围绕在少数几个值附近集中分布。

  • 泊松分布与正态分布相似,但存在偏斜率。象正态分布一样,在偏斜度值较低的情况下,泊松分布在各个方向上具有相对均匀的扩散。但是,当偏斜度值非常大的时候,我们的数据在不同方向上的扩散将会是不同的。在一个方向上,数据的扩散程度非常高,而在另一个方向上,扩散的程度则非常低。

如果遇到一个高斯分布,那么我们知道有很多算法,在默认情况下高思分布将会被执行地很好,因此首先应该找到那些算法。如果是泊松分布,我们必须要特别谨慎,选择一个在空间扩展上对变化要有很好鲁棒性的算法。

降维这个术语可以很直观的理解,意思是降低一个数据集的维数。在数据科学中,这是特征变量的数量。请看下图:

上图中的立方体表示我们的数据集,它有3个维度,总共1000个点。以现在的计算能力,计算1000个点很容易,但如果更大的规模,就会遇到麻烦了。然而,仅仅从二维的角度来看我们的数据,比如从立方体一侧的角度,可以看到划分所有的颜色是很容易的。

通过降维,我们将3D数据展现到2D平面上,这有效地把我们需要计算的点的数量减少到100个,大大节省了计算量。

另一种方式是我们可以通过特征剪枝来减少维数。利用这种方法,我们删除任何所看到的特征对分析都不重要。

例如,在研究数据集之后,我们可能会发现,在10个特征中,有7个特征与输出具有很高的相关性,而其它3个则具有非常低的相关性。那么,这3个低相关性的特征可能不值得计算,我们可能只是能在不影响输出的情况下将它们从分析中去掉。

用于降维的最常见的统计技术是PCA,它本质上创建了特征的向量表示,表明了它们对输出的重要性,即相关性。PCA可以用来进行上述两种降维方式的操作。

过采样和欠采样是用于分类问题的技术。例如,我们有1种分类的2000个样本,但第2种分类只有200个样本。这将抛开我们尝试和使用的许多机器学习技术来给数据建模并进行预测。那么,过采样和欠采样可以应对这种情况。请看下图:

在上面图中的左右两侧,蓝色分类比橙色分类有更多的样本。在这种情况下,我们有2个预处理选择,可以帮助机器学习模型进行训练。

欠采样意味着我们将只从样本多的分类中选择一些数据,而尽量多的使用样本少的分类样本。这种选择应该是为了保持分类的概率分布。我们只是通过更少的抽样来让数据集更均衡。

过采样意味着我们将要创建少数分类的副本,以便具有与多数分类相同的样本数量。副本将被制作成保持少数分类的分布。我们只是在没有获得更多数据的情况下让数据集更加均衡。

完全理解为什么在我们使用贝叶斯统计的时候,要求首先理解频率统计失败的地方。大多数人在听到“概率”这个词的时候,频率统计是首先想到的统计类型。它涉及应用一些数学理论来分析事件发生的概率,明确地说,我们唯一计算的数据是先验数据(prior data)。

假设我给了你一个骰子,问你掷出6点的几率是多少,大多数人都会说是六分之一。

但是,如果有人给你个特定的骰子总能掷出6个点呢?因为频率分析仅仅考虑之前的数据,而给你作弊的骰子的因素并没有被考虑进去。

贝叶斯统计确实考虑了这一点,我们可以通过贝叶斯法则来进行说明:

在方程中的概率P(H)基本上是我们的频率分析,给定之前的关于事件发生概率的数据。方程中的P(E|H)称为可能性,根据频率分析得到的信息,实质上是现象正确的概率。

例如,如果你要掷骰子10000次,并且前1000次全部掷出了6个点,那么你会非常自信地认为是骰子作弊了。如果频率分析做的非常好的话,那么我们会非常自信地确定,猜测6个点是正确的。同时,如果骰子作弊是真的,或者不是基于其自身的先验概率和频率分析的,我们也会考虑作弊的因素。

正如你从方程式中看到的,贝叶斯统计把一切因素都考虑在内了。当你觉得之前的数据不能很好地代表未来的数据和结果的时候,就应该使用贝叶斯统计方法。

本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击。


关于数据的正确程度,蒲老师的似乎特别重视P值的问题,其实从统计学角度,P值只不过显示差异存在的正确程度,或者错误程度,是否具有生物学意义,不能单从统计学差异来判断,例如差别确实存在,但非常小,说明有作用,但这种作用非常小,对生物体本身的价值非常小。例如我们过去曾经遇到过检测细胞内PH,两组的差别确实P<0.01可以说从统计的角度非常有差别,但是两组的平均数只是从7.41 到7.45.这样的两个数据都属于正常生理数值,有什么意义,可以说几乎没有什么意义。当然从学术角度,这样的改变仍有追踪的价值,只不过这样的价值十分不足。

关于数据可靠性,蒲老师主要从容易被人发现,造成个人信誉的丧失,其实更麻烦的问题是自己无法延续一个问题继续开展工作。如果我们的研究都给别人作为铺垫,当然容易被人发现,但许多情况下,我们前期的研究是后期研究的延伸和发展,如果数据存在问题,那么自己的课题如何延续下去就成为麻烦。这在许多课题组经常会遇到,不是有这样的说法吗?绝对不要重复本课题组前人的工作。那么延伸一下就是绝对不要重复别人的工作。那么在这样的科研环境下,如何才可以有真的科研。

蒲慕明认为“明知别人的工作结果,只要还没有发表,就可以抢先发表”是完全错误的,特别是通过交流了解到这样的信息,这种情况下必须和正在开展的同行讲清楚自己也正在开展类似工作。最理想的大家在同一时间先后发表,形成理想的交流效果。也就是说在学术交流过程中了解到的思路也是可以开展的,但应该告诉人家。

为了科学竞争,没有发表的结果不要告诉别人?蒲慕明认为这也是一种错误的认识,正确的作法是告诉别人,以获得更理想更可靠的更新想法。因为有的想法可能存在错误和缺陷,没有发表前的交流有利于学术发展。虽然确实有被别人抢先的风险。

关于知识产权,蒲慕明的看法更显得另类,但是确实应该如此。他认为看法是科研思路没有不应该有知识产权,许多所谓原始的科学想法,并不是凭空出现的,而是被别人的想法或知识触发的,根本不应该有什么知识产权的概念。知识产权是科学商业化、工程产品商业化所衍生的产物。如果我们在科学界把科学想法也赋予知识产权,科学家终将沦为商人,科学界将沦为全球商业世界的一部分。(确实是这样的,牛顿、爱因斯坦如果生活在3000年前,是没有可能提出牛顿定律和相对论的。)

蒲慕明关于学术的许多看法都非常值得学习,最有意思的是,每年他都会在所年会发表重要讲话,这是他最新的讲话内容,谈话的主题是关于科研诚信,且看蒲慕明所长的讲话内容。

 根据2012 年12 月28 日中科院神经所蒲慕明所长年会的讲话内容进行整理,主要是关于"谈灰色地带的科研诚信"。

我今天想讲的主题是过去主题的延续。几年前我曾经谈过诚信的问题。科学研究的诚信问题现在越来越重要。媒体上常有关于科学不端行为的报导,但事实上明目张胆的科学不端行为(scientific misconducts),所谓伪造、篡改和剽窃(Fabrication,Falsification,Plagiarism,简称FFP),是极少见的。现在最严重的问题不是明显的FFP,而是灰色地带的诚信问题,就是那些不容易被发现、标准不容易确定的问题。我们每一个从事科学研究的人都会遇到这些问题,都应该认真考虑,当遇到这些问题时,怎么做才符合诚信的要求。

二、数据分析和表述时的灰色地带行为

今天我首先想讲的就是数据分析和表述时的不当行为。首先,较严重的就是选择数据。只选择自己喜欢的结果,不喜欢的就不要。忽略不计对自己的结论有威胁性的数据。第二,在发表文章或口头表述结果时不当地夸大表述。前者比较容易判断是非,后者则是较困难判断的灰色地带问题。

1. 数据选择或排除的理由必须清楚地说明

实验得到的数据是不是可以进行选择?根据什么样的原则来决定哪些数据保留,哪些数据可以舍去?我们每个人都会遇到类似情况,下面说说我个人的看法。如果你刚刚开始做实验,还在慢慢地摸索各种实验条件,可能得到的结果不可靠。逐渐地你把各个实验条件都摸索清楚了,得到的结果越来越可靠、重复性高。比如说,初期手术操作慢,生物体损伤大,实验结果差,到操作熟练后,结果就大不相同了。生物材料确实存在这类问题。当你的实验越来越熟练的时候,得到的结果往往是更可靠的,而早期学习过程中获得的结果往往不可靠。这个时候你可以做数据选择,但是一定要非常明确地说明,从何时、使用何种参数的实验开始的数据都算,之前的全部都不算。你不能把先前“好的”数据选出来与后来的数据一起统计。这种“好的”要,“不好的”不要就是不当行为。在表述研究结果的时候,最好把所有的参数以及由于操作慢得不到好结果的情况也说出来。因为如果你在报导的时候不讲,别人就可能无法重复出你的结果。虽然他是因为操作不熟练而做不出预期的结果,他很有可能认为你得到的结论是错的。为了维护你研究数据的可靠性,让别人能够重复你的工作,你一定要把数据选择的过程都讲清楚。所以,实验数据是可以进行“限制性的选择”的,但选择的方式必须是合理的,在报导时也必须将选择过程有明确的交代。

2. 如何避免无意识的数据选择

但当我们在做数据采集或分析的时候,常常还会有无意识地选择数据的倾向。你知道分析的标本是什么,在无意识的情况下你可能会选择了你所期望得到的数据。比如说,你采集了40 个数据,得到的结果总的来说是合乎你的期望,你就觉得数据足够了,停止采集。但有可能当你采集了80 个数据的时候,这种现象就消失了。这种无意识的数据选择常常影响了实验的结论。现在大家做实验常常会出现这样的情况,课题是你个人的,实验自己做,取样自己取,标本自己分析,这种工作方式很不好。最好是通过合作的方式来采集或分析数据。比如你得到了实验样品后,可以请你的同学对你的样品进行编码,做盲实验(blindexperiment)。目的就是你自己做数据采集或分析时,不知道样品是哪一种。盲实验有单盲和双盲实验,我们就以单盲实验为例,简单来说就是数据采集或分析者不知道标本是实验组还是对照组。这一点很容易做到,如果是两个人合作,一人负责实验,另一人负责数据分析,彼此不知道样品的具体情况。即使是你一个人的课题,你既做实验又做分析,你也可以请同学帮忙,让他帮你把样品重新编码,然后你再来分析,得到结果后再解码。这么做的好处在于你对自己得到的结果会更有信心。尤其是当你得到了很惊人的结果时,一般人的第一反应是会怀疑你的数据的可靠性。如果你的论文中有描述:“我这些结果都是在blind experiment 的情况下得到的”,你的结论就会更有说服力。现在很少人在文章中能写出这句话,因为大部分人都没有做到数据采集分析是盲实验这一点。所以我建议以后在做采集分析数据时,采用盲实验的方法。

3. 不符合所期望的数据可能是有意义的,甚至是更重要的数据

我们常常希望看到想要的结果。如果实验结果符合你的假说,你会很高兴。但是那些不符合你所期望的数据,其实可能是有意义的,甚至可能是更重要的。为什么这么说呢?当我问一位同学:你现在正在做什么?得到的回答常常是:我在证实我的一个假说。其实这种说法其实是不正确的,因为我是永远不可能证实我的假说。我只可能做有限数量的实验,最多只能说是在有限条件下得到结果符合我的假说。因为谁也不可能去检测所有的条件,所以从逻辑上讲,没有一个假说是可以真正被证实的。我们在口语中常说:“I want to prove my hypothesis”。虽然口语说说无伤大雅,但这种说法可能无意识地造成一种偏见,认为实验工作的目的就是为了找到符合或“证实”自己假说的结果。比较正确的说法是:“我的实验是为了检测(test)我的假说”。因为在得到结果前,并不知道我的假说是对是错,所以假说只是帮助目前工作的假说(working hypothesis),而并不能证实(prove)我的假说。直到有一天,别人做了其它的实验,可能在不同的条件下发现我的假说根本不对。到那时候就得修正我的假说。所以,没有一个假说是可以永远成立的,即使牛顿定律也一样。鉴于此,当你被问到你在做什么时,真正最好的说法是:我在找推翻我的假说的证据(“I want to refute my hypothesis”)。这才是你真正应该做的事情。

如果你的实验结果并不符合你的假说,这可能是对科学更有意义的贡献。为什么这么说呢?我们先看看假说是怎么被提出来的。一般你都是根据目前大家的想法,再根据已有的实验结果,经过你的思考整合后提出的。也就是说,在目前已知的现象和概念下,这个假说可能是最合适的。如果你的实验结果并不符合这个假说,说明我们目前对自然现象的理解是不对的,需要进一步修正,这就是科学的进展。因此,推动科学进展的结果常常不是符合大家认为是合理的假说的证据,而是不合假说的证据。从这个角度讲,推翻你自己的或是别人的假说,应该才是实验工作的最好目标。如果你的实验数据不符合你现在的假说,这不是坏的实验数据,也不是实验不成功,事实上实验是真的成功了。当然你的实验数据必须可靠、有重复性,有时正有时负的数据是不可靠的,能重复得到的负结果和正结果一样是重要的结果,甚至更重要。总之,假说存在的价值就是可以作为推进科学进展的一个工具。假说是用来给人推翻的,而不是给人证实的(Hypothesis

我们说不符合你假说的数据,可能是最好的结果。因此在这种情况下,你要比较客观地来看待你的数据,这就不得不提一下数据的重复性。重复性是指,可靠的实验结果一定要能够被你自己或别人重复。在各位的实验室中,如果某一位同学得到了很重要的结果,我认为最好请实验室的另一位同学重复再做一次这个实验。如果结果能重复,那么对这个结果的信心就会大大增强。这也是我们要求合作的原因之一。合作研究不见得一定要做不同的实验,可以做同样的实验。如果得到一样的结果,大家都更有信心,写文章的时候就信心十足。数据的重复性是非常重要的,少数的例子是不可靠的,格外突出的结论需要格外有力的证据(Extraordinary claim demands extraordinary evidence)。尤其是关键性的重要实验,最好有格外强有力的证据, 重复性要高,与对照组有差别要大,误差(error bar)要小。这种证据下得到的结论才能让别人信服。

5. 什么是统计上有意义的结果

什么是统计上有意义的结果?举例说,我们得到了两组数据,它们的差别用t 检验法得到的p 值为0.045。我们一般认为p 值小于0.05,差别就是有意义的。你在报道结果时写成“Two groups are significantly different”,读者或者听众就会认为你的两组数据有非常显著的差别,但是实际上你的所谓“显著差别”只是在统计上达到了某种程度的意义(statistical 0.045”。你告诉读者这两组数据在统计学上达到了某种程度的差别,让读者自己去判断这种差别有多大的意义。你自己也要知道得到的p 值的意思,简单来说t 检验法得到的p 值若等于0.05,就是说有95%的可能性你的两组数据是有差别的,有5%的可能性是没有差别的,所以你一定要明确说出p 值的具体数值。生物学家常把p = 0.05 作为差别是否有意义的标准,有些物理学家认为这个标准很可笑,他们认为有意义的差别p 值应小于0.01 甚至0.001,标准是因人而异的。我们的两组数据差别如果p 值是0.055,我们就说结果没有意义。但是0.055和0.045 的差别到底有多大不同呢?也许你多做两次实验,你的p 值就从0.055变成了0.045,因为p 值与样本数(n 值)有关。也可能多做着两次实验要花费你很多时间精力,因此你不想做了。但是我认为,如果这是一个格外重要的结论,你的证据一定要非常充分,你的p 值标准应降到远低于0.05,不能只满足于0.05。如果你的两组数据p 值是0.055,你得到的结论“Two groups are not significantlydifferent”。我认为这样表达也不对,正确的表述应该是:“The 值是0.055,我也可以说两组数据有差别。我猜测0.055 的原因可能就是样本数不够,也许多做两次实验P 值就降到0.05 以下了。但是我不能说我的两组数据有显著差别,我只能告诉大家这两组数据的差别在p = 0.055 的水平,这就是如实地表述你得到的结果。所以“Two groups are different with statistical significanceat a

6.为什么不当的数据选择行为十分普遍

不合诚信的数据选择行为十分普遍,我认为主要有以下的原因。首先,不诚信的数据选择是很难被发现的。假设你独自一人做实验,没有选取某个数据,除了你自己没有其他人知道。但是我认为这么做的恶果是自己或别人被引导到错误的方向。因为你的结论是基于数据选择而得到的,事实上你就把自己绑在这个结论上。等到有一天别人得到了相反的结果,你就必须承认错误了。即使没有其他人发现,但也许相反的结果更加重要,而你已经被牢牢地限制在你的错误结论上。当有一天相反的结果被发现,你也只能承认过去的错误或者承认数据不充分。如果是被别人指出你的数据是错误的话,后果就更严重了。而且越是重要的发现,后果越严重。

有的人认为,发表自己知道不可靠的结果,似乎没有什么风险。很多论文都不能重复,我的论文不能重复又有什么关系。反正我的论文已经发表在顶尖的期刊上了,名声也已经建立了,顶尖期刊的很多其他论文也不能重复,所以有人愿意冒这个风险。这是为了短期的利益而冒的风险,因为不可靠的结论很快就会被发现,尤其是那些重要的结论(无关紧要的结论,也许没有人关心,不会被发现)。如果你从事的研究大家都很感兴趣,而你的科研事业就依赖于这项发现,那么发表不可靠结果的风险马上就会出现。感兴趣的研究一定会有人去重复,现在从事科研的人那么多,迟早是会被发现的。所以我认为相对于个人长期的科研事业,不当数据选择获得的利益是短期的,存在着很大的风险。如果你要在科学界长期生存,成为一位声誉好的科学家,你就不能不坚守诚信的标准。

1. 个人实验记录本的规范

下面我再谈谈实验记录本的问题,虽然我过去强调过一定要认真完成实验记录,但是我今天要有系统地再谈一下这个问题。

首先要强调实验记录本不是你个人的,它属于你所在的实验室,而且是实验室必需保存的重要资料。当你离开实验室时,所有的原始实验记录本都必须保留在实验室,你可以带走影印的副本,原件必须保留在实验室。实验记录本要保留在实验室,实验记录也必须非常仔细地完成。为什么要仔细记录呢?我不知道是否同学们认真思考过这个问题?我认为实验记录的目的包括:(1) 整理自己的思路,(2)实验的历史记录,(3)帮助自己回忆实验过程,(4)有助于他人重复你的实验,(5)在有不端行为控诉时,有为自己辩护的材料。

实验记录本是一件能够帮助整理自己思路的,很重要的工具。实验记录本上应该有做实验的目的,也应该能够反映出你整个实验的过程。你做实验记录的过程实际上也是你整理自己思路的过程。实验的历史记录。实验记录本上的内容也是你实验的历史,它能够帮助你回忆自己过去的实验过程。有可能实验完成若干年以后,你已经忘记了实验的内容和实验的目的,这个时候实验记录本可以帮助你回忆实验的过程。实验记录本不单单帮助你自己回忆,也能够帮助别人重复你的实验,这一点更加重要。几年以后,也许你的师弟师妹要开展下一步的工作,必须重复你的实验,你的实验记录本就是他(她)的“经典”资料,他必须根据你的实验记录来重复实验。如果实验结果出了问题(过去我们所发生过类似的事件),我们就必须详细地审查过去的实验记录本,查看当初到底是怎么回事。所以当有控诉不端行为的时候,实验记录本也是为自己辩护的材料。假如是有很好的记录,你就有很好的资料来为自己辩护。

实验记录本上应该有5 项内容,请大家一定要记住,别的内容可以不记录,这5 项内容必须齐全。(1)日期 (记录本必需是装订好有印好页数的本子,不能是活页本),(2)实验的名称, (3)实验目的的简短说明, (4)实验的叙述, (5)结果的总结(和解释)。

几年前我就要求所里的研究生在做年度进展报告的时候要提供实验记录本,我参加的时候都会翻阅一下。虽然没有仔细去看,但还是看到很多问题,这5项一般都不全。第一项日期都是有的。必需强调一点,实验记录本必须是装订好的,不能是活页的本子(神经所有统一制作的实验记录本,所有记录本均有编号和领用记录),这是所有实验记录本的规矩,尤其是在工业界。将来无论你从事哪一行,科学研究也好,工业界也好,这个规矩是通用的。你现在养成良好的习惯,对你将来的事业是很有帮助的。

实验的名称大家都没写。实验名称要写明是做什么实验,比如今天是“测量cAMP 的水平”或者“测量在XX 条件变化下XX 基因的表达水平”等等,一般来说简单一句话即可。名称下面,应该用简短的一段话说明实验的目的,即为什么要做这个实验,比如“之前得到了XXX 结果,所以今天要做XXX 实验”。之后就要叙述实验的过程,写清楚这个实验是怎么做的。比如今天做的是麻醉动物的电生理记录,那么至少要写清楚“什么时候开始麻醉,如何麻醉,多少剂量,什么内容等等”,总之要把实验的详细内容叙述清楚。我经常看到同学的实验记录本上大部分是数字、剂量,缺少详细的描述过程,有些数字只有实验者本人知道代表的意思,外人或者其他需要重复你实验的人很难理解。实验叙述完以后,还应该有对结果的总结或解释。按照实验的类别不同,有的结果需要分析后得出,但是有的结果当场就可以分析(解释)。即使当时分析不出来,我也建议你分析好以后补充进去。比如“今天得到的数据,发现麻醉剂量过度,因此得到的数据数量有限,造成实验可能不成功,下次实验应该改变什么样的剂量”。

实验记录的5 项内容,一般花个十分钟就可以完成了。既然你已经做了一天的实验,为什么不能再花十分钟把实验记录做完整呢?我希望大家做完实验马上写实验记录,写完实验记录才算完成了一天的实验任务。养成良好的实验记录习惯,将来受惠无穷。如果将来你去做博士后,你的导师翻开你的实验记录本,这5 项内容都有,他将会印象深刻。假如看到的是我们现在的实验记录本,就会觉得离标准实在太远了。

2. 必须保存原始数据资料

现在很多数据资料不是记录在实验记录本上的,数字化的数据是保存在磁盘或者计算机中的。这类原始数据资料必须妥善保存。几年前美国显微镜学会(Microscopy Society of America)制定了有关数字化图像的处理规定,他们定义了符合科研道德的处理数字化图片的方式(Ethical digital image processing,Microscopy Today, Nov/Dec 2003, p. 61)。他们认为,图片资料存档如保存在CD-R光盘上,该图片资料必须是未经压缩或其他操作处理的原始图片资料。这么做的目的是什么呢?假如你在CD 上保存的是处理过的图片,将来写论文的时候,如果需要改变图片的某一个参数(如对比度),你在CD 上的图片已经经过处理,再也无法找到原始的图片。所以保存在CD 上的必须是最原始的资料,即使你要保存处理过的资料,你必须另外存一份原始资料。图像文件资料的处理和生成的所有参数,随后的处理步骤等,都必须存档并记录,以保证资料能够被重新处理组成。你在实验记录本上,必须详细地记录你未处理过的资料保存在什么地方,处理过的资料保存在什么地方,这样别人才能通过实验记录最终找到原始的资料。电生理的数据也是一样。比如,你应该保存所有原始的膜电位或脉冲数据,而不是经过分析后的图表。

实验室组长要监督这些事情。在写论文之前,实验室组长必须要检查过所有的原始数据。虽然这很困难,但却是不可避免的工作。实验室组长要注意实验的细节和原始数据资料,不要只看最后组成的图表。实验室组长还应该培育良好的实验室文化,尊重实验操作符合伦理的态度,强调规范地做好实验记录。希望各位组长能够一起努力做到这一点。

四、挂名为共同作者的要求和责任

另外一个灰色地带的问题涉及到共同作者的问题。现在很多论文都有一大批共同作者,所以科学界应该对共同作者有一个共识,各位也应该对共同作者有一个正确的理解。我们对第一作者的要求比较清楚,但目前有很多共同作者的署名是不合理的。现在很多期刊都要求写清楚作者的贡献,即使某些期刊不需要撰写作者贡献,你也可以自己在文中提供这些资料。这么做的好处就是帮助你排除不应该挂名作者的人,有时候别人想挂名,你把贡献内容列出来,没有实质贡献的人就知道自己不应该作为共同作者。以网络期刊Neural

大家特别要注意提供材料的人的挂名问题,所提供的材料必须是本人制作的(manufactured),不能是他人制作的再转送给你。这两者是有本质区别的,现在有很多不合理的挂名行为,比如提供了一个鼠,而这个鼠又不是他本人制作的,也要求挂名。过去论文只有一两个作者的时候,文章的贡献比较容易鉴别,现在很多作者的情况下,作者的贡献必须写清楚。如果不写清楚,也许同行的人,熟悉该项工作的人是知道每个作者的具体贡献。但是不了解情况的人,也许会认为某些挂名的人为论文做了相当大的贡献。现在甚至有些人明明没有什么贡献,别人只提供了部分材料(如小鼠),也要求担任共同通讯作者。如果按照下述的作者贡献的要求,这是极不合理的。

那么究竟谁可以被列为作者呢?国际医学期刊主编委员会(InternationalCommittee of Medical Journal Editors)曾经讨论并制订出了以下的标准:“作者必须对本文章在以下各方面有过相当的贡献:研究的初始想法和设计,数据的采集、分析、和解释,文章书写或修订时有实质内容的贡献,并同意最终所发表文章的内容”。新英格兰医学杂志(New England Journal of Medicine)的编辑ArnoldRelman 也曾经明确地列出了共同作者的责任:“(1)任何同意列名为作者的人都担起主要的责任, 应能随时公开为该文辩护,因此必须对该文的可靠性应有信心。(2)给予或接受共同作者的原因不能只是为了报偿该作者提供了资源或资助了一位主要完成工作的人员。(3)只要是共同作者,必须对所有的内容负责,不可以只对部分内容负责。”因此,如果论文出现了错误,不可以推托自己只参与了部分研究工作,是别人的实验出现错误。共同作者应共享论文带来的荣耀,同时也共同承担错误的责任。共同作者也必须对论文有信心。曾经出现过有外面的人员到神经所的实验室做实验,使用了实验室的设备,愿意将实验室的几位研究人员挂名为作者,这些人没有拒绝。结果论文最后被人指出有造假行为,神经所的研究人员受到牵连。所以今后如果有人在你的实验室做实验,如果你对他的数据没有信心,你没有参与工作,你就不应该挂名为共同作者。另外,你不能因为提供了设备甚至资助了完成工作的人员就挂名,更不能把挂名作为一个“礼物”。所有的医学期刊都认为共同作者的署名应该遵守上述的原则,其实生物学期刊也是一样。虽然他们没有讨论制定统一的标准,但是如果你去问他们,他们会叫你遵循相同的规则。

抄袭别人的成果作为自己的工作发表是最严重的剽窃行为。这种情况很容易被发现。很多论文的撤回(retraction),重大的学术不端行为都是这种情况。另一种剽窃是一字不差地(整句或整段)复制别人的文字而没有注明出处。这种文字剽窃的程度不尽相同,有的情节很严重,有的相对不严重,但依然被认定为剽窃。比如一字不差的抄袭别人的实验方法(methods)或者引言(introduction)。有的学生解释说因为英文的写作能力差,想学习别人的写作。我认为学习是可以,但是要改写(paraphrase),可以用类似的词或者类似的语法来学习别人的写作方法。千万不能一字不差的抄袭,特别是实验方法,这会被认定为文字剽窃。除了剽窃别人的,还有自我剽窃。有些发表的论文,重复使用实验室已经发表过的实验方法文字,或者把已经发表过的文字穿插在新的论文中。甚至还有数据的自我剽窃,比如以前的论文已经发表了的数据里加入新的数据,作为新的结果来发表。总结一下文字剽窃的规则,如果你的论文中有超过整段的文字,包括引言、材料、方法等等,已经在其他论文中出现过,那么将会被定义为剽窃。更严格的标准是超过7 个字一模一样的连续出现,就被认定为剽窃。如果你必需再次使用自己已发表文章中相当长的一部分(如实验方法),你必须清楚地写明你是在引用以前的文章。有些期刊已设有筛检剽窃的工具(如Crosscheck)可迅速筛检已发表论文与送审论文之间的相同文句()。使用Crosscheck 的期刊,编辑在收到网上投稿的论文以后,在送审之前先会发送到Crosscheck 进行在线筛选,看是否已有类似的文字发表过。所以在文章撰写中一定要注意文字剽窃的问题,避免收到无谓的指责。

最后,我要谈谈我认为科学界最严重的灰色地带剽窃行为,就是偷取别人的想法、方法、结果,或复制别人的实验或发现,作为自己的成果发表而没有适当地提到别人的工作。比如有位来访的同行学者,参加了实验室的组会或通过与实验室人员的交谈,了解到了某些研究结果的信息,回去以后从事相同的工作,而且完全不告知被访的实验室,并抢在该实验室之前先发表了同样的结果。你控诉他不诚信时,他还可振振有词的说:“我一直有同样的想法,也在做同样的工作,只是没先说出来而已”。你自己愿意告诉他你的研究结果,没有法定约束他一定得告诉你他在做什么。虽然他可以为自己辩护,但在科学上这就是一种不诚信。有的人认为只要别人没有发表,就是在进行科学竞争。如果科学研究都沦落到必需使用不诚信的手段进行竞争,这将是科学走下坡路的征兆。

六、科学交流与科学竞争

下面我要特别来讲和科研诚信直接有关的科学交流与科学竞争的问题。我会列举几种观点,做一个简单的民意调查,然后再谈谈我的看法。

1. 明知别人的工作结果,只要他们还没有发表,我可以抢先发表?(少数听众同意此观点)

除了上述的同行来访的例子。通过交流听到别人未发表的信息,回去后靠所得到的讯息做出同样的结果,并抢先发表。为什么在未发表前人家愿意告诉你呢?一方面是为了要与你交流听听你的意见,另一方面也是告诉你,他已经首先有了这个发现。你如果得到了信息后,在短时间内抢先发表,这种做法就是灰色地带的不端行为。说是灰色地带,因为你可以说我原来就在做这个工作,是独立的发现,没有人有确切的证据说你在说谎。还有人认为这就是科学竞争。没有发表的成果就没有优先发现的正式认可,但是我不同意这种观点。科学界对公平竞争还是有不成文的规矩的,对科学家的诚信标准还是有共识的。刚才我们投票的结果就说明我们大多数在座的是认为如果明知别人已得到的结果,自己照着做,抢先发表是不对的。假如一个科学家不断地做这种事情,那么科学界终将判定他是一个没有诚信的科学家,他是不会受人尊敬的,他在这个科学领域也是不会有发展的,这是他得到的恶果。当然还是会有人为了出一两篇重要论文,完全不顾这种后果。

2. 为了科学竞争,没有发表的结果不要告诉别人?(更多的听众赞成此观点,但赞同的人未过半数)

目前科学界已经出现了科学交流与科学竞争之间的矛盾。但是科学世界中最有可贵的内容就是科学交流,做科学家的乐趣很大成分是源于科学交流。什么是交流?你把没有发表的内容,不成熟的想法告诉别人,别人给你反馈,然后你再进一步改善自己的想法。反过来说,你也从别人那里得知最新的未发表的讯息。交流已发表的成果这种效果就小得多。交流未发表的结果,有可能成果被人抢走,上面我已举了例子。我认为一个态度开放,愿意同别人交流自己没有发表结果的学者,虽然偶尔可能被别人抢了研究成果,但是他长远上的收获是大于他偶然遇到几次的损失。我从事了40 年的研究,我也曾遇到自己的成果被别人抢走,但我还是愿意告诉别人我的想法,未发表的成果。我坚信作为一个长期在科学界工作的人,开放交流的态度可能会让你偶尔吃些小亏(也许偶尔吃次大亏),但从长远来讲,利大于弊。

再举例来说,为什么我们要去参加美国的神经科学年会?成千上万个墙报都是没有发表的工作。很多墙报前都聚集了一群感兴趣的同行,给你建议或批评,你能得到很多反馈,可以在未发表前提高你的工作水平。当然也可能有人偷偷地看了你的墙报,回去做实验抢你的成果,但是给你建议的同行远远要比只偷看你墙报的人多。正因为交流未发表的研究工作有好处,所以才会有上万人愿意展示他们未发表的工作。

从另一个角度讲,公开介绍未发表的工作也是告诉大家,我已经先有此发现,请不用再做同样的工作了。但是大部分学者知道了以后,会认为这方面工作已经有人做了,不会去花功夫重复你的工作。但如果你的发现是极为重要的,一定会有些人赶着去重复。一方面,他们不一定相信你的结果,另一方面他们也想捷足先登。这也没有什么不对的,但有诚信的做法是他应该告诉你,他对此问题也有兴趣,已经在或者将会去研究这个问题。如果双方大致在同时完成工作,可一起发表论文。我们常常在同一期杂志上看到唱双簧的两篇back-to-back 的文章,多半是这么来的,而不是碰巧两个实验室同时独立完成同样的工作。这种有交流又有竞争的科研是件好事,因为两个实验室的做法不见得完全一样,总体结果的可信度也更高。总体上来说,科学交流与科学竞争并不一定是有矛盾的,只要大家以诚信的态度交流,以公平的方式竞争。

3. 为了知识产权,不要把自己的好想法告诉别人(有许多听众赞成此观点,赞同的人近半数)

有人说我有一个很特好的想法,想到了一个特妙的实验,不能告诉别人,因为我有知识产权(intellectual property),要先保密。虽然科学史上有牛顿和莱布尼茨关于谁发明微积分之争,但是知识产权不是科学界的概念。所有的科学想法都不是凭空而来,即使是爱因斯坦的时空不变性理论,李政道和杨振宁的弱作用中宇称不守恒理论。这些有创新性的想法,其实也是建立在别人的基础之上。比如时空不变性理论是建筑在Lorentz 和 Maxwell 的场论之上;宇称不守恒的可能性也曾经有其他人提过,只不过没有人像李杨那样完整地描述这个概念并提出可检测的实验。所以我认为,所谓的科学想法,不是凭空出现的,而是被别人的想法或知识触发的,根本不应该有什么知识产权的概念。知识产权是科学商业化、工程产品商业化所衍生的产物。如果我们在科学界把科学想法也赋予知识产权,科学家终将沦为商人,科学界将沦为全球商业世界的一部分。

七、 科学工作者对社会的责任

科学的目标就是追求真理,而诚信是追求真理的必要条件。这种诚信不单单是黑白分明的诚信,还包括灰色地带的诚信。科学界应最不能容忍各种不诚信行为,包括浮夸、欺骗行为。为什么要特别注意灰色地带的问题?就是因为在灰色地带的不诚信行为,最终将累积而成极端的恶果。再举一例,似是而非地浮夸自己的科技成果或浮夸自己将要获得的成果,不能仅仅看作是获取科研支助时不可避免的公关手段。有位认识干细胞造假事件主角黄禹锡的韩国同行朋友曾经告诉我,大家都知道黄禹锡一向喜欢夸张报导他的成果,大家都也一直容忍他的做法,以为这只是他的个人作风,是为他自己甚至为大家争取科研经费的公关行为。但是黄禹锡从浮夸到实际造假,不过一步之差。我们发表了一篇高档期刊的论文,就向媒体宣称在某领域有重大突破,为治疗某某疾病找到了治疗靶点。这种长期对社会大众的浮夸,已造成社会是对科学家信心的下降。科学工作者应是维护社会诚信的主力。如果连科学界都不讲诚信,怎能要求社会大众讲诚信?为建立诚信的社会,科学工作者必需从自己做起,从小事做起。是非分明,实事求是,严守诚信的标准。自己讲诚信,再进一步影响别人。

八、中国科学家对世界的贡献

我从事了四十多年的科学研究工作,遇见过海内外各式各样的“科学家”,也看到了海内外科学界的各种现象。我一直在思考中国科学家、在座各位科研工作者将来对世界会有什么贡献?今天在座的同学很多人将来都要出国,有好几位马上就要离去。你们出去学什么?如果出去以后只是学到一套不诚信的做法,学会了不公平的竞争方式,那就不合学科学的初衷了。

1. 比较西方科学家和中国知识份子的传统

谈到中国科学家对科学界可能有的贡献,我想先比较一下西方科学家的传统和中国知识分子的传统。我们现在看到的西方科学家,都是以自我为中心,追求个人的科学兴趣和个人的成就,这是西方科学家的传统。而中国知识分子的传统是完全不同的。传统的中国知识分子不是以自我为中心的,更常见的是一种忘我精神和对社会的关怀。西方的科学家努力的最高的目标常常就是获得诺贝尔奖,因为那是科学成就的最高体现。但是,科学家对社会的贡献不是只从个人成就来判定的,只顾个人成就甚至有很多负面的影响。我所知的有个别诺贝尔奖得主是在不公平竞争下,甚至于是践踏其他科学家的基础上获奖的。我们的社会并不需要这样的科学家。西方科学家的传统和中国知识分子的传统似乎是不相容的,社会目前需要的是在追求个人兴趣和成就的西方个人主义之中注入中国知识分子的关怀社会的精神。

2. 什么是科学界的大师?

媒体经常会提到“钱学森之问”,最近也有记者在采访时问我,现在中国科学界为什么缺少大师?我们怎样才可以培养出新一代的大师?我反问他,你说的的大师是什么样的大师?是个人成就很高,发表高档论文无数,得过国际大奖的科学家?但是我们中国曾经出现过的大师,比如教育界的蔡元培,建筑学的梁思成,气象学的竺可桢等等可不是这样的。以竺可桢的能力,他完全可以做出世界一流的学术成就,但他却在学术生命最旺盛的时候,奔波中国各地用最简单的仪器设备建设气象站,后来觉得办教育比建气象站重要,就到浙江大学去做校长。像这样的大师们是个人学术成就最高,发表的顶尖论文最多吗?我认为不是。更近一辈的还有数学家华罗庚、力学家钱学森、生理学家张香桐、生化学家王应睐等等,他们是当之无愧的大师,但不是因为他们个人的学术成就最高,而是因为他们影响了一大批科学家,带领了一批从事科研工作的人,做出了重要的成果,这才是我们心中大师的标准。他们所做的科学事业的是对社会最有用的,这才是我们社会需要的大师。我想,只有先明白什么样的人算是大师,才有可能培养出我们需要的大师。

3. 什么是科学界的大牛?

除了大师以外,近十年来还出现了“大牛”一词。我经常会听到学生说,“XXX来做报告,他是大牛,一定要去听他的报告”。我每次听到“大牛”这个词,脑海中就会浮现出牛的画面。我脑海中出现的大牛形象有西方斗牛场中那种横冲直撞、伤人为上的公牛(bull),还有我小时候在南方水田里看见的水牛(buffalo),那些在田里举步维艰的拖着耕犁,勤恳耕耘的水牛。我们现在科学界有太多像公牛一样的所谓“大牛”,许多横行霸道的bully,为了达到目的而不择手段的大牛。我希望各位同学不要去学那些以自我为中心的横行霸道的公牛,要学“俯首甘为孺子牛”的水牛。

4. 现代社会需要的科学家

现在世界上的迫切需要解决的问题太多了

上一篇200条金句反响比较强烈,有很多粉丝给老赵留言,让老赵分享一些千川的投放经验。今天老赵就给大家分享120条巨量千川的投放经验,内容大部分来自于孤狼和尹晨的分享,老赵也结合了一些自己的投放经验做了一些补充,希望给刚入门千川投放的小伙伴一些帮助。如果有粉丝想继续提问,可以在老赵营销笔记后台留言给老赵。如果问题很多,老赵之后会再出一篇千川相关的问答内容。大家也可以关注买量江湖的公众号获得更多投放相关的经验。

废话不多说,干货走起!

1、千川广告投放的底层机制是什么?

这个问题,可以这么理解。一名用户在刷抖音内容,刷到一定数量的时候,会刷到一条信息流广告,也就是一次广告展现的机会,而每次遇到这样的广告展现机会,会有N条广告在争抢这个展现机会,但最终谁能胜出系统会根据ECPM值来给争抢展现机会的广告做个排序,而影响ECPM值的因素有三个:eCTR(用户对广告的预期点击概率)、eCVR(用户对广告点击之后产生的预期转化率)和出价。

2、哪些因素会影响eCTR?

用户刷到一个广告为什么会点击?背后的原因直接影响eCTR,呈现给用户的整体内容效果,直接决定点击率的高低。千川广告有两种投放模式一种是直播间直投,另一种是投素材。如果是直播间直投模式,直播场景的打造、主播的即视感、话术、直播间氛围、热卖商品等因素都会影响点击率;如果是投创意素材,商品本身、商品的展示模式、话术卖点的提炼、拍摄场景、拍摄模式及剪辑模式都会影响点击率。

3、哪些因素会影响eCVR?

2)投放后台的设置精准性;

3)直播场景的营销性;

4)主播本身以及对于商品销售的讲款、打单、逼单能力及话术;

4、影响千川计算的数据是否出现延迟的情况呢?

账户整体和分计划数据会存在一定的延迟情况,如想观察实时数据,可关注【工具-今日直播】延迟较小。

5、直播带货,自播各阶段核心目标和指标有哪些?

1)冷启动期:核心目标【直播间互动数据、人群标签】,指标建议关注【停留时长、互动频率】

2)成长期:核心目标【直播间互动数据、人群标签、转化率、UV值】,指标建议关注【停留时长、带货转化率、UV值】

3)成熟期:核心目标【GMV】,指标建议关注【UV价值、停留时长、整场GMV、人均客单价】

6、 商品点击率对直播间的影响大么?

商品点击率会对直播间流量有影响,但是一定要理解直播间的流量不是单一因素影响,可能是直播间点击率、转化率、GPM、评论数、点赞数、直播间停留等各项指标综合影响的结果。

7、短视频脚本创意一般通过什么找 ?

巨量创意、蝉妈妈、抖查查、飞瓜等;

8、(专业版千川投放代餐直播间)为什么我设置了行业兴趣+行为,预估有3-5千万,投放下单,完全没有消耗。怎么办?

1)确认计划审核通过且正常开启。

81、千川直播投短视频,是只投一个产品的视频好还是多个一起好?

千川短视频引流直播间,视频内容里产品数量可根据直播间主题来确定。

1)若为品牌专场、明星专场、达人专场等复杂货品场次,短视频内容可包含多个商品及营销属性相关内容;

2)若为日常直播或单场直播,可以引流款或爆款为主吸引消费者点击;

巨量引擎广告审核规范及法律规定:

特殊case可联系对接业务同学提交广告复审;

93、双库存引流素材需要具备什么特质?完全无利益点类素材或成主流?

千川优质素材建议:vlog形式 - 聚焦”产品种草“而非”产品销售“,分享产品使用体验、弱化价格利益点刺激,给予用户真实、舒缓、亲近的观看体验;

素材多从”用户视角“出发,营造强烈的场景代入感,第一视角亲身试用分享;- 素材通过“优化视觉观感”,传递美好体验:画质清晰明亮、配乐曲风温和欢快,画面色彩明艳丰富;

94、成单类计划可以正常消耗对直播账号有哪些要求(粉丝量,点赞量,互动量,在线量)?

与传统平台类电商广告靠提价提高资源位排名不同,千川信息流广告除了出价因素外,还会综合考虑直播间素材质量、互动&内容指标(点赞、评论、关注、停留等)、电商向指标(GMV、48h发货率、带货口碑分、店铺体验分等)

95、消耗撞预算后,无法恢复正常消耗怎么办?

撞预算后,计划会自动关停;若暂停时间过久,重新启动后会结合前期积累数据重新探索人群投放,需要一段探索时间;若暂停时间不长,通常可快速恢复;若出现暂停很短但跑量影响大这类特殊case,可联系对接销售/运营排查;

96、玉石类间断商闪购商品,选择什么转化目标最优?

千川体系下,优先直播间下单转化目标,整体roi较高;同时可结合直播间营销节奏选择其他转化目标或双转化目标;

97、高客单价的商品如何选择转化目标?

高客单商品优先选择直播间下单转化目标保证ROI;同时可配合浅层转化目标定投老粉来降低成本;

98、初做直播没有粉丝,直播间引流适合投随心推还是直播间广告投放,直投的优势是什么?

直播初期,建议使用小店随心推和极速推广模式来做加粉提升,创编链路及使用成本均较低;直投直播间相对短视频引流直播间的优势在于,直播画面相对原生,门槛也较低;

99、 直播间引流和短视频引流直播间适用什么场景?

1)使用门槛:直投直播间适用于所有类型的商家及达人,门槛较低,效果较好;短视频引流直播间对引流素材质量要求较高,素材质量越高,引流效果越好;反之没有优质素材输出能力,不建议使用短视频引流直播间;

2)营销场景:短视频引流直播间可通过设置素材内容来进行大促或者促销货品信息的前端展示,此类场景短视频引流效果会更优;

3)稳定性:直投直播间因为主播、话术等不同,所以稳定性相对短视频引流略低;同时,直投直播间对于客户教育成本会更高一些;

100、推广目的:抖音号推广和商品推广有什么差异?我应该选什么推广目的?

千川体系下只区分短视频图文带货和直播带货两种营销目标;

101、为什么账户有的计划突然爆量?

1)直播间内容指标优化提升,会导致广告跑量能力提高;

2)直播间营销节奏也会影响跑量能力,如秒杀款、引流款、福袋、评论等;

3)放量投放时会优先完成预算目标,投放过程成本会有浮动;

4)系统波动也会导致爆量,可联系对接销售同学排查;

5)可参考以下方式做调整:建议降低出价水平;

6)设置单计划预算及广告组预算,防止计划跑飞;

7)选择控成本投放(PC)及精准定向人群 ;

102、什么是闪购?闪购适合玉石吗?

主播可以在开播过程中,根据直播间画面快速创建商品,并在看播端快速售卖给买家。适用于商品种类多、库存少类型的商品,尤其适用于服装、玉石等非标商品;多用于因商品种类过多无法提前上传、或直播中临时上传商品的场景。也可以用线下谈好单来直播间成交,直播间闪购完成交易的方式提升直播间转化率。

103、当日订单GMV里,数据显示是算包含下单之后有退款的情况吗?

千川成交订单金额是指:广告带来的成交订单金额(包含在线支付成功和货到付款已确认的订单);退款情况在下单、运输、收货后等场景下均有可能产生,不计入千川成交订单金额;

104、千川后台里,直播间成单转化数和当日订单数据为什么会有不一样的时候?

在【直播间下单】转化目标下,转化数可以理解成一个客户产生了下单行为;广告带来的成交订单数(包含在线支付成功和货到付款已确认的订单);转化的客户实际下单量并非一定为一笔订单,所以会存在数据不一致的情况;

105、目前抖音号推广和商品推广,都只能看到小店的对应数据吗?

1)千川体系下营销目标只涉及短视频/图文带货、直播间带货两种营销目标;

2)账户及计划数据均为投放的对应直播间/商品广告数据;

3)今日直播可看到直播间整体数据(自然+广告);

106、同支视频,可以同时授权给多个广告账户使用吗?

短视频引流直播间可以;短视频带货需为挂车短视频,且购物车中商品需为广告主绑定抖店商品;

107、什么情况下已授权达人视频,但无法在创意里拉取?

1)短视频:创意需为挂车短视频,且购物车中商品需为广告主绑定抖店商品、视频设私密、视频授权过期;

2)直播:视频设私密、视频授权过期;

108、 自然流量和千川流量怎么配比才能帮助直播间起量?

主流直播间整场直播自然流量 VS 广告流量配比通常为 8:2 ,但在开播前期及直播间营销节点需要快速引入流量时,千川流量占比会拉高;

109、为什么随心推的订单老是审核不通过?

1)审核被拒:可在审核原因处查看拒审原因并做对应修改;建议在创建计划前做好投放资质的审核以及素材商品的优化,创意素材越优质,整体通过率越高;

2)素材制作前可参考【巨量千川准入&管控规则指引】:

3)需要提交资质时,可在小店随心推订单界面提交资质;

4)若确认提交修改无误,依旧无法通过审核,可联系对接销售做复审操作及by case排查;

110、账户每天只能跑两万的消耗,跑到2万左右之后账户直接被限流了,后面一点量都没有,戛然而止,跑量速度和计划成本都是正常的状态,导致每天只能有1个小时左右有消耗。这个问题产生的原因是什么,以及怎么解决?

1)优先自查48h发货率、店铺体验分及带货口碑分是否在限流值以下,通常为此类情况限流导致预算只能消耗部分;

2)可参考【巨量千川准入&管控规则指引】:

111、 直播间设置限时秒杀,在商家后台创建完活动后,是否在直播间生效?非直播渠道进入的例如广告渠道会不会同时触发该秒杀活动?

1)商家/主播流程:开启直播 → 在直播中控台添加商品 → 设置秒杀 → 配置秒杀时间 → 配置各SKU的秒杀价格、库存、限购数量 → 开始秒杀;

2)任何渠道进入到直播间,只要满足秒杀要求,都可以参加秒杀活动;

112、很多人说投千川转化目标要投成单,那么观看、评论目标是否就不具备现实意义?

并不是!如果本身直播间人货场足够强大,那么投观看和评论出价低转化也不错,可以降低直播间的投放成本,但是这种直播间在当前少之又少。

113、每条计划一般要设置多少预算?

考虑到每种转化目标的跑量速率,一般情况下,按照投放预算去进行比例分配最佳,比如1万预算跑ROI,那么核心在成单,就应该给成单分配足够的预算,点击计划分配100以内的预算足够,进入计划更多起的人群探索更直播间氛围的效果,三五百的预算也已经足够。具体仍然还是要看直播间的具体情况,以及每种目标的用途。

114、如何在投放中调控出价?

前期为了跑量,可以选择高于同行的平均水平5-10个点出价。通过高出价,快速跑出适合你产品的稳定模型。一般来讲,对于新计划初期出价,我们的期望成本高出一些,等到这个计划跑过测试期以后,再慢慢降低出价到目标成本,当然新计划出价抢量也要注意成本的控制,出价最多也不能超过你设定目标价的百分之四十,不然即便量级成功跑出,也可能面临成本超过目标价太多,很难压制下来的窘境。

115、计划跑起来如何补量?

账户一旦创建好计划后,投手要做的就是不断坚持上新,充分发挥每一个创意的拓展探索能力,从而观察不同创意带来的数据呈现,日常运营保持适当补量,以防创意衰退即可。如果创意本身难以获取平稳的效果,整体账户效果就很难稳定,多建计划更易发掘优质创意,所以广告推广效果不稳定的账户,对创意的需求量更大,所以广告计划的上新要上到提量为止。

116、计划初期成本很高,是否要关掉重新跑?

首先看一下是不是初期回传延迟导致的成本偏高。如果成本没有高的,不建议暂停,先观察一段时间数据,给他一点学习的时间。当系统积累过足够的模型之后,量级就会变得更加精准,成本也可能会慢慢回落。

117、跑得好的计划是否可以复制?

复制的前提是跑量计划的衰退。衰退计划的根本,在于在单条计划下,系统已经难以探索产品所需要的人群,进而整体消耗开始拉低;其次是计划在扩容时,外部流量的探索越来越宽放,导致模型被稀释化,在高成本转化下计划变成无效计划。但众所周知,跑量ok的计划,即便生命周期完成,但是重新进行复制,却同样有着很高的概率能够跑出来,因为计划的复制之间会存在模型继承的关系,可以续命。

118、什么时候选择上新计划?

为了避免青黄不接的现象,在进行计划运营时,最好的状态是推广效果好的时候可以适度减少上新计划,不用上过多的计划。账户效果好的时候,你的成本是可以接受的,甚至是低于你的预期成本。那么这部分多出来的预算可以拿去进行测试,推广效果差的时候需要提前大量上新计划,可以新老素材一块上,老素材是之前跑的效果较好的素材,但是不要完全复制,可以设置的不一样点,哪怕就是素材换个音乐都可以。

119、如何看直播间数据?投放主要关注哪些指标?目标投产比roi如何计算?

1)巨量千川中可根据直播带货广告计划,查看计划维度直播间数据,也可根据【工具-今日直播】来查看直播数据;后续会上线直播广告大屏产品也可查看直播间数据;

2)投放关注的指标一般基于转化目标关注不同的指标。比如【直播间下单】建议关注转化数据,【直播间商品点击】建议关注商品的点击数据等,整体数据建议关注GPM、ROI转化成本等;

120、如何加快学习期的问题

建议先尽量扩大曝光,而扩大曝光的最大化手段就是出价,通过高出价,快速跑出适合你产品的稳定模型。一般来讲,对于新计划初期出价,我们的期望成本高出一些,等到这个计划跑过测试期以后,再慢慢降低出价到目标成本,当然新计划出价抢量也要注意成本的控制,出价最多也不能超过你设定目标价的百分之四十,不然即便量级成功跑出,也可能面临成本超过目标价太多,很难压制下来的窘境。

巨量千川的投放细节太多了,老赵今天这篇只是针对几个社群里小伙伴们长文的问题,做了一个总结性内容,非常有助于新手快速的了解千川投放的一些细节,大家看不完的话可以把这篇文章收藏起来或者分享给你觉得对他有用的人。老赵开发的抖音电商课程中也会包含千川投放的部分,会帮助大家系统性的梳理一下千川的玩法和细节。针对千川投放有问题的小伙伴也可以给老赵留言,老赵会整理完后回复。

我要回帖

更多关于 吴云医学的哲学是真是假 的文章

 

随机推荐