第1章導論
1.1簡介
1.2本書的組織結構
1.3如何使用本書
1.3.1應該使用何種檢驗
1.3.2我需要多大的樣本量
1.3.3你不必手動計算
1.4本章要點
1.5本章思考題
1.6參考資料
第2章量化用戶研究
2.1什麼是用戶研究
2.2用戶研究的數據
2.3可用性測試
2.3.1樣本量
2.3.2代錶性和隨機性
2.3.3數據收集
2.3.4任務完成率
2.3.5可用性問題
2.3.6任務時間
2.3.7齣錯數
2.3.8滿意度評分
2.3.9復閤分數
2.4A/B測試
2.5調查數據
2.5.1等級量錶
2.5.2淨推薦值
2.5.3評論和開放性數據
2.6需求收集
2.7本章要點
2.8參考資料
第3章我們的估算到底有多準確
3.1簡介
3.1.1置信區間=誤差幅度的兩倍
3.1.2置信區間提供瞭精確度和位置
3.1.3置信區間的三個組成部分
3.2完成率的置信區間
3.2.1置信區間的曆史
3.2.2Wald區間:對於小樣本來說就太不靠譜瞭
3.2.3精確置信區間
3.2.4Wald校正區間:增加兩個成功與兩個失敗
3.2.5完成率的最佳點估計
3.2.6遭遇可用性問題的置信區間
3.3等級量錶和其他連續性數據的置信區間
3.3.1任務時長數據的置信區間
3.3.2任務時長均值還是任務時長中位數
3.3.3幾何均值
3.3.4大樣本任務時長的置信區間
3.3.5圍繞中位數的置信區間
3.4本章要點
3.5本章思考題
3.6參考資料
第4章我們達到或超過目標瞭嗎
4.1簡介
4.2單側檢驗和雙側檢驗
4.3完成率與基準的比對
4.3.1小樣本檢驗
4.3.2大樣本檢驗
4.4滿意度分數與基準的比對
4.5任務時間和基準的比對
4.6本章要點
4.7本章思考題
4.8參考資料
第5章不同設計之間有統計學差異嗎
5.1簡介
5.2比較兩個平均值(等級量錶和反應時)
5.2.1被試內設計比較——配對t檢驗
5.2.2比較任務時長
5.2.3組間比較(雙樣本t檢驗)
5.2.4t檢驗的假設
5.3比較完成率、轉換率以及A/B測試
5.3.1組間比較
5.3.2組內比較
5.4本章要點
5.5本章思考題
5.6參考資料
第6章我們需要多大的樣本量 第一部分:總結性研究
6.1簡介
6.1.1我們為何要關注
6.1.2可用性研究的類型至關重要
6.1.3總結性可用性測試樣本量預估的基本原則
6.2預估數值
6.3比較數值6.4如何控製變異性
6.5二項置信區間樣本量的估計
6.5.1大樣本的二項樣本量估計
6.5.2小樣本的二項樣本量估計
6.5.3與基準比例相比較的樣本量
6.6卡方檢驗的樣本量預估(獨立比例)
6.7 MCNEMAR精確檢驗的樣本預估(配對比例)
6.8本章要點
6.9本章思考題
6.10參考資料
第7章我們需要多大的樣本量 第二部分:形成性研究
7.1簡介
7.2使用發現問題的概率模型來估計形成性用戶研究的樣本量
7.2.1著名方程:P(x≥1)=1-(1-p)
7.2.2從1-(1-p)中推導齣樣本量估計方程
7.2.3使用錶格計劃形成性用戶研究樣本量
7.3二項概率模型的假設
7.4模型的附加應用
7.4.1估計多重問題或其他事件的復閤p值
7.4.2校正小樣本p的復閤估計值
7.4.3估計可發現的問題數和未被發現的問題數
7.5影響p值的是什麼
7.6什麼是閤理的目標問題發現率
7.7調解“神奇的數字5”和“8還不夠”
7.7.1一段曆史:20世紀80年代
7.7.2又一段曆史:20世紀90年代
7.7.3“神奇的數字5”的起源
7.7.4“8還不夠”:一個調解方法
7.8更多關於二項概率公式和其小樣本校正
7.8.1二項概率公式的起源
7.8.2緊縮校正是如何起作用的
7.9針對問題發現的其他統計模型
7.9.1對問題發現使用二項式模型的批評
7.9.2擴展的二項式模型
7.9.3 Capture- recapture模型
7.9.4在計劃形成性用戶研究時為什麼不用其他模型
7.10本章要點
7.11本章思考題
7.12參考資料
第8章標準化的可用性問捲
8.1簡介
8.1.1什麼是標準化的間捲
8.1.2標準化可用性問捲的優點
8.1.3什麼樣的標準化可用性問捲是有用的
8.1.4標準化問捲的質量評估:信度、效度和靈敏度
8.1.5問捲的步距數
8.2整體評估問捲
8.2.1QUS(用戶交互滿意度問捲)
8.2.2SUMI(軟件可用性測試問捲)
8.2.3 PSSUQ
8.2.4SUS(軟件可用性問捲)
8.2.5可用性整體評估問捲的實驗比較
8.3任務評估問捲
8.3.1場景後問捲
8.3.2單項難易度問捲
8.3.3主觀腦力負荷問題
8.3.4期望評級
8.3.5可用性等級評估
8.3.6任務評估問捲的實驗比較
8.4網站感知可用性的評估問捲
8.4.1網站分析和測量問捲
8.4.2標準通用的百分等級問捲
8.4.3其他評估網站的問捲
8.5其他有趣的問捲
8.5.1計算機係統可用性問捲
8.5.2有用性、滿意度、易用性
8.5.3用戶經驗的可用性度量
8.5.4享受性質量
8.5.5美國消費者滿意度指標
8.5.6淨推薦值
8.5.7福雷斯特客戶體驗指數
8.5.8技術接受模型
8.6本章要點
8.7本章思考題
8.8參考資料
第9章測量和統計的六大持久論戰
9.1介紹
9.2對多點量錶數據進行平均閤理嗎
9.2.1一方觀點
9.2.2另一方觀點
9.2.3我們的推薦
93需要測試至少30名用戶嗎
9.3.1一方觀點
9.3.2另一方觀點
9.3.3我們的推薦
9.4所有的實驗都要進行雙側檢驗嗎
9.4.1一方觀點
9.4.2另一方觀點
9.4.3我們的推薦
9.5當p>0.05時,我們能拒絕原假設嗎
9.5.1一方觀點
9.5.2另一方觀點
9.5.3我們的推薦
9.6能將各種可用性度量指標閤並到一個分數中嗎
9.6.1一方觀點
9.6.2另一方觀點
9.6.3我們的推薦
9.7假使你需要進行多次檢驗該怎麼辦
9.7.1一方觀點
9.7.2另一方觀點
9.7.3我們的推薦
9.8本章要點
9.9本章思考題
9.10參考資料
第10章 總結
10.1簡介
10.2更多信息
10.3好運
10.4本章要點
10.5參考資料
附錄A基礎統計概念速成
· · · · · · (
收起)