upstream/mercurial-mirror Commit - r33456:ae052d04

1

# changegroup.py - Mercurial changegroup manipulation functions

1

# changegroup.py - Mercurial changegroup manipulation functions

2

#

2

#

3

4

#

4

#

5

# This software may be used and distributed according to the terms of the

5

# This software may be used and distributed according to the terms of the

6

# GNU General Public License version 2 or any later version.

6

# GNU General Public License version 2 or any later version.

7

8

from __future__ import absolute_import

8

from __future__ import absolute_import

9

10

import os

10

import os

11

import struct

11

import struct

12

import tempfile

12

import tempfile

13

import weakref

13

import weakref

14

15

from .i18n import _

15

from .i18n import _

16

from .node import (

16

from .node import (

17

hex,

17

hex,

18

nullrev,

18

nullrev,

19

short,

19

short,

20

)

20

)

21

22

from . import (

22

from . import (

23

dagutil,

23

dagutil,

24

discovery,

24

discovery,

25

error,

25

error,

26

mdiff,

26

mdiff,

27

phases,

27

phases,

28

pycompat,

28

pycompat,

29

util,

29

util,

30

)

30

)

31

32

_CHANGEGROUPV1_DELTA_HEADER = "20s20s20s20s"

32

_CHANGEGROUPV1_DELTA_HEADER = "20s20s20s20s"

33

_CHANGEGROUPV2_DELTA_HEADER = "20s20s20s20s20s"

33

_CHANGEGROUPV2_DELTA_HEADER = "20s20s20s20s20s"

34

_CHANGEGROUPV3_DELTA_HEADER = ">20s20s20s20s20sH"

34

_CHANGEGROUPV3_DELTA_HEADER = ">20s20s20s20s20sH"

35

36

def readexactly(stream, n):

36

def readexactly(stream, n):

37

'''read n bytes from stream.read and abort if less was available'''

37

'''read n bytes from stream.read and abort if less was available'''

38

s = stream.read(n)

38

s = stream.read(n)

39

if len(s) < n:

39

if len(s) < n:

40

raise error.Abort(_("stream ended unexpectedly"

40

raise error.Abort(_("stream ended unexpectedly"

41

" (got %d bytes, expected %d)")

41

" (got %d bytes, expected %d)")

42

% (len(s), n))

42

% (len(s), n))

43

return s

43

return s

44

45

def getchunk(stream):

45

def getchunk(stream):

46

"""return the next chunk from stream as a string"""

46

"""return the next chunk from stream as a string"""

47

d = readexactly(stream, 4)

47

d = readexactly(stream, 4)

48

l = struct.unpack(">l", d)[0]

48

l = struct.unpack(">l", d)[0]

49

if l <= 4:

49

if l <= 4:

50

if l:

50

if l:

51

raise error.Abort(_("invalid chunk length %d") % l)

51

raise error.Abort(_("invalid chunk length %d") % l)

52

return ""

52

return ""

53

return readexactly(stream, l - 4)

53

return readexactly(stream, l - 4)

54

55

def chunkheader(length):

55

def chunkheader(length):

56

"""return a changegroup chunk header (string)"""

56

"""return a changegroup chunk header (string)"""

57

return struct.pack(">l", length + 4)

57

return struct.pack(">l", length + 4)

58

59

def closechunk():

59

def closechunk():

60

"""return a changegroup chunk header (string) for a zero-length chunk"""

60

"""return a changegroup chunk header (string) for a zero-length chunk"""

61

return struct.pack(">l", 0)

61

return struct.pack(">l", 0)

62

63

def writechunks(ui, chunks, filename, vfs=None):

63

def writechunks(ui, chunks, filename, vfs=None):

64

"""Write chunks to a file and return its filename.

64

"""Write chunks to a file and return its filename.

65

66

The stream is assumed to be a bundle file.

66

The stream is assumed to be a bundle file.

67

Existing files will not be overwritten.

67

Existing files will not be overwritten.

68

If no filename is specified, a temporary file is created.

68

If no filename is specified, a temporary file is created.

69

"""

69

"""

70

fh = None

70

fh = None

71

cleanup = None

71

cleanup = None

72

try:

72

try:

73

if filename:

73

if filename:

74

if vfs:

74

if vfs:

75

fh = vfs.open(filename, "wb")

75

fh = vfs.open(filename, "wb")

76

else:

76

else:

77

# Increase default buffer size because default is usually

77

# Increase default buffer size because default is usually

78

# small (4k is common on Linux).

78

# small (4k is common on Linux).

79

fh = open(filename, "wb", 131072)

79

fh = open(filename, "wb", 131072)

80

else:

80

else:

81

fd, filename = tempfile.mkstemp(prefix="hg-bundle-", suffix=".hg")

81

fd, filename = tempfile.mkstemp(prefix="hg-bundle-", suffix=".hg")

82

fh = os.fdopen(fd, pycompat.sysstr("wb"))

82

fh = os.fdopen(fd, pycompat.sysstr("wb"))

83

cleanup = filename

83

cleanup = filename

84

for c in chunks:

84

for c in chunks:

85

fh.write(c)

85

fh.write(c)

86

cleanup = None

86

cleanup = None

87

return filename

87

return filename

88

finally:

88

finally:

89

if fh is not None:

89

if fh is not None:

90

fh.close()

90

fh.close()

91

if cleanup is not None:

91

if cleanup is not None:

92

if filename and vfs:

92

if filename and vfs:

93

vfs.unlink(cleanup)

93

vfs.unlink(cleanup)

94

else:

94

else:

95

os.unlink(cleanup)

95

os.unlink(cleanup)

96

97

class cg1unpacker(object):

97

class cg1unpacker(object):

98

"""Unpacker for cg1 changegroup streams.

98

"""Unpacker for cg1 changegroup streams.

99

100

A changegroup unpacker handles the framing of the revision data in

100

A changegroup unpacker handles the framing of the revision data in

101

the wire format. Most consumers will want to use the apply()

101

the wire format. Most consumers will want to use the apply()

102

method to add the changes from the changegroup to a repository.

102

method to add the changes from the changegroup to a repository.

103

104

If you're forwarding a changegroup unmodified to another consumer,

104

If you're forwarding a changegroup unmodified to another consumer,

105

use getchunks(), which returns an iterator of changegroup

105

use getchunks(), which returns an iterator of changegroup

106

chunks. This is mostly useful for cases where you need to know the

106

chunks. This is mostly useful for cases where you need to know the

107

data stream has ended by observing the end of the changegroup.

107

data stream has ended by observing the end of the changegroup.

108

109

deltachunk() is useful only if you're applying delta data. Most

109

deltachunk() is useful only if you're applying delta data. Most

110

consumers should prefer apply() instead.

110

consumers should prefer apply() instead.

111

112

A few other public methods exist. Those are used only for

112

A few other public methods exist. Those are used only for

113

bundlerepo and some debug commands - their use is discouraged.

113

bundlerepo and some debug commands - their use is discouraged.

114

"""

114

"""

115

deltaheader = _CHANGEGROUPV1_DELTA_HEADER

115

deltaheader = _CHANGEGROUPV1_DELTA_HEADER

116

deltaheadersize = struct.calcsize(deltaheader)

116

deltaheadersize = struct.calcsize(deltaheader)

117

version = '01'

117

version = '01'

118

_grouplistcount = 1 # One list of files after the manifests

118

_grouplistcount = 1 # One list of files after the manifests

119

120

def __init__(self, fh, alg, extras=None):

120

def __init__(self, fh, alg, extras=None):

121

if alg is None:

121

if alg is None:

122

alg = 'UN'

122

alg = 'UN'

123

if alg not in util.compengines.supportedbundletypes:

123

if alg not in util.compengines.supportedbundletypes:

124

raise error.Abort(_('unknown stream compression type: %s')

124

raise error.Abort(_('unknown stream compression type: %s')

125

% alg)

125

% alg)

126

if alg == 'BZ':

126

if alg == 'BZ':

127

alg = '_truncatedBZ'

127

alg = '_truncatedBZ'

128

129

compengine = util.compengines.forbundletype(alg)

129

compengine = util.compengines.forbundletype(alg)

130

self._stream = compengine.decompressorreader(fh)

130

self._stream = compengine.decompressorreader(fh)

131

self._type = alg

131

self._type = alg

132

self.extras = extras or {}

132

self.extras = extras or {}

133

self.callback = None

133

self.callback = None

134

135

# These methods (compressed, read, seek, tell) all appear to only

135

# These methods (compressed, read, seek, tell) all appear to only

136

# be used by bundlerepo, but it's a little hard to tell.

136

# be used by bundlerepo, but it's a little hard to tell.

137

def compressed(self):

137

def compressed(self):

138

return self._type is not None and self._type != 'UN'

138

return self._type is not None and self._type != 'UN'

139

def read(self, l):

139

def read(self, l):

140

return self._stream.read(l)

140

return self._stream.read(l)

141

def seek(self, pos):

141

def seek(self, pos):

142

return self._stream.seek(pos)

142

return self._stream.seek(pos)

143

def tell(self):

143

def tell(self):

144

return self._stream.tell()

144

return self._stream.tell()

145

def close(self):

145

def close(self):

146

return self._stream.close()

146

return self._stream.close()

147

148

def _chunklength(self):

148

def _chunklength(self):

149

d = readexactly(self._stream, 4)

149

d = readexactly(self._stream, 4)

150

l = struct.unpack(">l", d)[0]

150

l = struct.unpack(">l", d)[0]

151

if l <= 4:

151

if l <= 4:

152

if l:

152

if l:

153

raise error.Abort(_("invalid chunk length %d") % l)

153

raise error.Abort(_("invalid chunk length %d") % l)

154

return 0

154

return 0

155

if self.callback:

155

if self.callback:

156

self.callback()

156

self.callback()

157

return l - 4

157

return l - 4

158

159

def changelogheader(self):

159

def changelogheader(self):

160

"""v10 does not have a changelog header chunk"""

160

"""v10 does not have a changelog header chunk"""

161

return {}

161

return {}

162

163

def manifestheader(self):

163

def manifestheader(self):

164

"""v10 does not have a manifest header chunk"""

164

"""v10 does not have a manifest header chunk"""

165

return {}

165

return {}

166

167

def filelogheader(self):

167

def filelogheader(self):

168

"""return the header of the filelogs chunk, v10 only has the filename"""

168

"""return the header of the filelogs chunk, v10 only has the filename"""

169

l = self._chunklength()

169

l = self._chunklength()

170

if not l:

170

if not l:

171

return {}

171

return {}

172

fname = readexactly(self._stream, l)

172

fname = readexactly(self._stream, l)

173

return {'filename': fname}

173

return {'filename': fname}

174

175

def _deltaheader(self, headertuple, prevnode):

175

def _deltaheader(self, headertuple, prevnode):

176

node, p1, p2, cs = headertuple

176

node, p1, p2, cs = headertuple

177

if prevnode is None:

177

if prevnode is None:

178

deltabase = p1

178

deltabase = p1

179

else:

179

else:

180

deltabase = prevnode

180

deltabase = prevnode

181

flags = 0

181

flags = 0

182

return node, p1, p2, deltabase, cs, flags

182

return node, p1, p2, deltabase, cs, flags

183

184

def deltachunk(self, prevnode):

184

def deltachunk(self, prevnode):

185

l = self._chunklength()

185

l = self._chunklength()

186

if not l:

186

if not l:

187

return {}

187

return {}

188

headerdata = readexactly(self._stream, self.deltaheadersize)

188

headerdata = readexactly(self._stream, self.deltaheadersize)

189

header = struct.unpack(self.deltaheader, headerdata)

189

header = struct.unpack(self.deltaheader, headerdata)

190

delta = readexactly(self._stream, l - self.deltaheadersize)

190

delta = readexactly(self._stream, l - self.deltaheadersize)

191

node, p1, p2, deltabase, cs, flags = self._deltaheader(header, prevnode)

191

node, p1, p2, deltabase, cs, flags = self._deltaheader(header, prevnode)

192

return {'node': node, 'p1': p1, 'p2': p2, 'cs': cs,

192

return {'node': node, 'p1': p1, 'p2': p2, 'cs': cs,

193

'deltabase': deltabase, 'delta': delta, 'flags': flags}

193

'deltabase': deltabase, 'delta': delta, 'flags': flags}

194

195

def getchunks(self):

195

def getchunks(self):

196

"""returns all the chunks contains in the bundle

196

"""returns all the chunks contains in the bundle

197

198

Used when you need to forward the binary stream to a file or another

198

Used when you need to forward the binary stream to a file or another

199

network API. To do so, it parse the changegroup data, otherwise it will

199

network API. To do so, it parse the changegroup data, otherwise it will

200

block in case of sshrepo because it don't know the end of the stream.

200

block in case of sshrepo because it don't know the end of the stream.

201

"""

201

"""

202

# an empty chunkgroup is the end of the changegroup

202

# an empty chunkgroup is the end of the changegroup

203

# a changegroup has at least 2 chunkgroups (changelog and manifest).

203

# a changegroup has at least 2 chunkgroups (changelog and manifest).

204

# after that, changegroup versions 1 and 2 have a series of groups

204

# after that, changegroup versions 1 and 2 have a series of groups

205

# with one group per file. changegroup 3 has a series of directory

205

# with one group per file. changegroup 3 has a series of directory

206

# manifests before the files.

206

# manifests before the files.

207

count = 0

207

count = 0

208

emptycount = 0

208

emptycount = 0

209

while emptycount < self._grouplistcount:

209

while emptycount < self._grouplistcount:

210

empty = True

210

empty = True

211

count += 1

211

count += 1

212

while True:

212

while True:

213

chunk = getchunk(self)

213

chunk = getchunk(self)

214

if not chunk:

214

if not chunk:

215

if empty and count > 2:

215

if empty and count > 2:

216

emptycount += 1

216

emptycount += 1

217

break

217

break

218

empty = False

218

empty = False

219

yield chunkheader(len(chunk))

219

yield chunkheader(len(chunk))

220

pos = 0

220

pos = 0

221

while pos < len(chunk):

221

while pos < len(chunk):

222

next = pos + 2**20

222

next = pos + 2**20

223

yield chunk[pos:next]

223

yield chunk[pos:next]

224

pos = next

224

pos = next

225

yield closechunk()

225

yield closechunk()

226

227

def _unpackmanifests(self, repo, revmap, trp, prog, numchanges):

227

def _unpackmanifests(self, repo, revmap, trp, prog, numchanges):

228

# We know that we'll never have more manifests than we had

228

# We know that we'll never have more manifests than we had

229

# changesets.

229

# changesets.

230

self.callback = prog(_('manifests'), numchanges)

230

self.callback = prog(_('manifests'), numchanges)

231

# no need to check for empty manifest group here:

231

# no need to check for empty manifest group here:

232

# if the result of the merge of 1 and 2 is the same in 3 and 4,

232

# if the result of the merge of 1 and 2 is the same in 3 and 4,

233

# no new manifest will be created and the manifest group will

233

# no new manifest will be created and the manifest group will

234

# be empty during the pull

234

# be empty during the pull

235

self.manifestheader()

235

self.manifestheader()

236

repo.manifestlog._revlog.addgroup(self, revmap, trp)

236

repo.manifestlog._revlog.addgroup(self, revmap, trp)

237

repo.ui.progress(_('manifests'), None)

237

repo.ui.progress(_('manifests'), None)

238

self.callback = None

238

self.callback = None

239

240

def apply(self, repo, tr, srctype, url, targetphase=phases.draft,

240

def apply(self, repo, tr, srctype, url, targetphase=phases.draft,

241

expectedtotal=None):

241

expectedtotal=None):

242

"""Add the changegroup returned by source.read() to this repo.

242

"""Add the changegroup returned by source.read() to this repo.

243

srctype is a string like 'push', 'pull', or 'unbundle'. url is

243

srctype is a string like 'push', 'pull', or 'unbundle'. url is

244

the URL of the repo where this changegroup is coming from.

244

the URL of the repo where this changegroup is coming from.

245

246

Return an integer summarizing the change to this repo:

246

Return an integer summarizing the change to this repo:

247

- nothing changed or no source: 0

247

- nothing changed or no source: 0

248

- more heads than before: 1+added heads (2..n)

248

- more heads than before: 1+added heads (2..n)

249

- fewer heads than before: -1-removed heads (-2..-n)

249

- fewer heads than before: -1-removed heads (-2..-n)

250

- number of heads stays the same: 1

250

- number of heads stays the same: 1

251

"""

251

"""

252

repo = repo.unfiltered()

252

repo = repo.unfiltered()

253

def csmap(x):

253

def csmap(x):

254

repo.ui.debug("add changeset %s\n" % short(x))

254

repo.ui.debug("add changeset %s\n" % short(x))

255

return len(cl)

255

return len(cl)

256

257

def revmap(x):

257

def revmap(x):

258

return cl.rev(x)

258

return cl.rev(x)

259

260

changesets = files = revisions = 0

260

changesets = files = revisions = 0

261

262

try:

262

try:

263

# The transaction may already carry source information. In this

263

# The transaction may already carry source information. In this

264

# case we use the top level data. We overwrite the argument

264

# case we use the top level data. We overwrite the argument

265

# because we need to use the top level value (if they exist)

265

# because we need to use the top level value (if they exist)

266

# in this function.

266

# in this function.

267

srctype = tr.hookargs.setdefault('source', srctype)

267

srctype = tr.hookargs.setdefault('source', srctype)

268

url = tr.hookargs.setdefault('url', url)

268

url = tr.hookargs.setdefault('url', url)

269

repo.hook('prechangegroup', throw=True, **tr.hookargs)

269

repo.hook('prechangegroup', throw=True, **tr.hookargs)

270

271

# write changelog data to temp files so concurrent readers

271

# write changelog data to temp files so concurrent readers

272

# will not see an inconsistent view

272

# will not see an inconsistent view

273

cl = repo.changelog

273

cl = repo.changelog

274

cl.delayupdate(tr)

274

cl.delayupdate(tr)

275

oldheads = set(cl.heads())

275

oldheads = set(cl.heads())

276

277

trp = weakref.proxy(tr)

277

trp = weakref.proxy(tr)

278

# pull off the changeset group

278

# pull off the changeset group

279

repo.ui.status(_("adding changesets\n"))

279

repo.ui.status(_("adding changesets\n"))

280

clstart = len(cl)

280

clstart = len(cl)

281

class prog(object):

281

class prog(object):

282

def __init__(self, step, total):

282

def __init__(self, step, total):

283

self._step = step

283

self._step = step

284

self._total = total

284

self._total = total

285

self._count = 1

285

self._count = 1

286

def __call__(self):

286

def __call__(self):

287

repo.ui.progress(self._step, self._count, unit=_('chunks'),

287

repo.ui.progress(self._step, self._count, unit=_('chunks'),

288

total=self._total)

288

total=self._total)

289

self._count += 1

289

self._count += 1

290

self.callback = prog(_('changesets'), expectedtotal)

290

self.callback = prog(_('changesets'), expectedtotal)

291

292

efiles = set()

292

efiles = set()

293

def onchangelog(cl, node):

293

def onchangelog(cl, node):

294

efiles.update(cl.readfiles(node))

294

efiles.update(cl.readfiles(node))

295

296

self.changelogheader()

296

self.changelogheader()

297

cgnodes = cl.addgroup(self, csmap, trp, addrevisioncb=onchangelog)

297

cgnodes = cl.addgroup(self, csmap, trp, addrevisioncb=onchangelog)

298

efiles = len(efiles)

298

efiles = len(efiles)

299

300

if not cgnodes:

300

if not cgnodes:

301

repo.ui.develwarn('applied empty changegroup',

301

repo.ui.develwarn('applied empty changegroup',

302

config='empty-changegroup')

302

config='empty-changegroup')

303

clend = len(cl)

303

clend = len(cl)

304

changesets = clend - clstart

304

changesets = clend - clstart

305

repo.ui.progress(_('changesets'), None)

305

repo.ui.progress(_('changesets'), None)

306

self.callback = None

306

self.callback = None

307

308

# pull off the manifest group

308

# pull off the manifest group

309

repo.ui.status(_("adding manifests\n"))

309

repo.ui.status(_("adding manifests\n"))

310

self._unpackmanifests(repo, revmap, trp, prog, changesets)

310

self._unpackmanifests(repo, revmap, trp, prog, changesets)

311

312

needfiles = {}

312

needfiles = {}

313

if repo.ui.configbool('server', 'validate'):

313

if repo.ui.configbool('server', 'validate'):

314

cl = repo.changelog

314

cl = repo.changelog

315

ml = repo.manifestlog

315

ml = repo.manifestlog

316

# validate incoming csets have their manifests

316

# validate incoming csets have their manifests

317

for cset in xrange(clstart, clend):

317

for cset in xrange(clstart, clend):

318

mfnode = cl.changelogrevision(cset).manifest

318

mfnode = cl.changelogrevision(cset).manifest

319

mfest = ml[mfnode].readdelta()

319

mfest = ml[mfnode].readdelta()

320

# store file cgnodes we must see

320

# store file cgnodes we must see

321

for f, n in mfest.iteritems():

321

for f, n in mfest.iteritems():

322

needfiles.setdefault(f, set()).add(n)

322

needfiles.setdefault(f, set()).add(n)

323

324

# process the files

324

# process the files

325

repo.ui.status(_("adding file changes\n"))

325

repo.ui.status(_("adding file changes\n"))

326

newrevs, newfiles = _addchangegroupfiles(

326

newrevs, newfiles = _addchangegroupfiles(

327

repo, self, revmap, trp, efiles, needfiles)

327

repo, self, revmap, trp, efiles, needfiles)

328

revisions += newrevs

328

revisions += newrevs

329

files += newfiles

329

files += newfiles

330

331

deltaheads = 0

331

deltaheads = 0

332

if oldheads:

332

if oldheads:

333

heads = cl.heads()

333

heads = cl.heads()

334

deltaheads = len(heads) - len(oldheads)

334

deltaheads = len(heads) - len(oldheads)

335

for h in heads:

335

for h in heads:

336

if h not in oldheads and repo[h].closesbranch():

336

if h not in oldheads and repo[h].closesbranch():

337

deltaheads -= 1

337

deltaheads -= 1

338

htext = ""

338

htext = ""

339

if deltaheads:

339

if deltaheads:

340

htext = _(" (%+d heads)") % deltaheads

340

htext = _(" (%+d heads)") % deltaheads

341

342

repo.ui.status(_("added %d changesets"

342

repo.ui.status(_("added %d changesets"

343

" with %d changes to %d files%s\n")

343

" with %d changes to %d files%s\n")

344

% (changesets, revisions, files, htext))

344

% (changesets, revisions, files, htext))

345

repo.invalidatevolatilesets()

345

repo.invalidatevolatilesets()

346

347

if changesets > 0:

347

if changesets > 0:

348

if 'node' not in tr.hookargs:

348

if 'node' not in tr.hookargs:

349

tr.hookargs['node'] = hex(cl.node(clstart))

349

tr.hookargs['node'] = hex(cl.node(clstart))

350

tr.hookargs['node_last'] = hex(cl.node(clend - 1))

350

tr.hookargs['node_last'] = hex(cl.node(clend - 1))

351

hookargs = dict(tr.hookargs)

351

hookargs = dict(tr.hookargs)

352

else:

352

else:

353

hookargs = dict(tr.hookargs)

353

hookargs = dict(tr.hookargs)

354

hookargs['node'] = hex(cl.node(clstart))

354

hookargs['node'] = hex(cl.node(clstart))

355

hookargs['node_last'] = hex(cl.node(clend - 1))

355

hookargs['node_last'] = hex(cl.node(clend - 1))

356

repo.hook('pretxnchangegroup', throw=True, **hookargs)

356

repo.hook('pretxnchangegroup', throw=True, **hookargs)

357

358

added = [cl.node(r) for r in xrange(clstart, clend)]

358

added = [cl.node(r) for r in xrange(clstart, clend)]

359

phaseall = None

359

if srctype in ('push', 'serve'):

360

if srctype in ('push', 'serve'):

360

# Old servers can not push the boundary themselves.

361

# Old servers can not push the boundary themselves.

361

# New servers won't push the boundary if changeset already

362

# New servers won't push the boundary if changeset already

362

# exists locally as secret

363

# exists locally as secret

363

#

364

#

364

# We should not use added here but the list of all change in

365

# We should not use added here but the list of all change in

365

# the bundle

366

# the bundle

366

if repo.publishing():

367

if repo.publishing():

367

phases.~~advanceboundary~~(~~repo~~, tr, phases.public, ~~cgnodes~~)

368

targetphase = phaseall = phases.public

368

else:

369

else:

370

# closer target phase computation

371

369

# Those changesets have been pushed from the

372

# Those changesets have been pushed from the

370

# outside, their phases are going to be pushed

373

# outside, their phases are going to be pushed

371

# alongside. Therefor `targetphase` is

374

# alongside. Therefor `targetphase` is

372

# ignored.

375

# ignored.

373

phases.~~advanceboundary~~(~~repo~~, tr, phases.draft, ~~cgnodes~~)

376

targetphase = phaseall = phases.draft

374

phases.retractboundary(repo, tr, phases.draft, added)

377

if added:

375

else:

378

phases.registernew(repo, tr, targetphase, added)

376

phases.retractboundary(repo, tr, targetphase, added)

379

if phaseall is not None:

380

phases.advanceboundary(repo, tr, phaseall, cgnodes)

377

381

378

if changesets > 0:

382

if changesets > 0:

379

383

380

def runhooks():

384

def runhooks():

381

# These hooks run when the lock releases, not when the

385

# These hooks run when the lock releases, not when the

382

# transaction closes. So it's possible for the changelog

386

# transaction closes. So it's possible for the changelog

383

# to have changed since we last saw it.

387

# to have changed since we last saw it.

384

if clstart >= len(repo):

388

if clstart >= len(repo):

385

return

389

return

386

390

387

repo.hook("changegroup", **hookargs)

391

repo.hook("changegroup", **hookargs)

388

392

389

for n in added:

393

for n in added:

390

args = hookargs.copy()

394

args = hookargs.copy()

391

args['node'] = hex(n)

395

args['node'] = hex(n)

392

del args['node_last']

396

del args['node_last']

393

repo.hook("incoming", **args)

397

repo.hook("incoming", **args)

394

398

395

newheads = [h for h in repo.heads()

399

newheads = [h for h in repo.heads()

396

if h not in oldheads]

400

if h not in oldheads]

397

repo.ui.log("incoming",

401

repo.ui.log("incoming",

398

"%s incoming changes - new heads: %s\n",

402

"%s incoming changes - new heads: %s\n",

399

len(added),

403

len(added),

400

', '.join([hex(c[:6]) for c in newheads]))

404

', '.join([hex(c[:6]) for c in newheads]))

401

405

402

tr.addpostclose('changegroup-runhooks-%020i' % clstart,

406

tr.addpostclose('changegroup-runhooks-%020i' % clstart,

403

lambda tr: repo._afterlock(runhooks))

407

lambda tr: repo._afterlock(runhooks))

404

finally:

408

finally:

405

repo.ui.flush()

409

repo.ui.flush()

406

# never return 0 here:

410

# never return 0 here:

407

if deltaheads < 0:

411

if deltaheads < 0:

408

ret = deltaheads - 1

412

ret = deltaheads - 1

409

else:

413

else:

410

ret = deltaheads + 1

414

ret = deltaheads + 1

411

return ret, added

415

return ret, added

412

416

413

class cg2unpacker(cg1unpacker):

417

class cg2unpacker(cg1unpacker):

414

"""Unpacker for cg2 streams.

418

"""Unpacker for cg2 streams.

415

419

416

cg2 streams add support for generaldelta, so the delta header

420

cg2 streams add support for generaldelta, so the delta header

417

format is slightly different. All other features about the data

421

format is slightly different. All other features about the data

418

remain the same.

422

remain the same.

419

"""

423

"""

420

deltaheader = _CHANGEGROUPV2_DELTA_HEADER

424

deltaheader = _CHANGEGROUPV2_DELTA_HEADER

421

deltaheadersize = struct.calcsize(deltaheader)

425

deltaheadersize = struct.calcsize(deltaheader)

422

version = '02'

426

version = '02'

423

427

424

def _deltaheader(self, headertuple, prevnode):

428

def _deltaheader(self, headertuple, prevnode):

425

node, p1, p2, deltabase, cs = headertuple

429

node, p1, p2, deltabase, cs = headertuple

426

flags = 0

430

flags = 0

427

return node, p1, p2, deltabase, cs, flags

431

return node, p1, p2, deltabase, cs, flags

428

432

429

class cg3unpacker(cg2unpacker):

433

class cg3unpacker(cg2unpacker):

430

"""Unpacker for cg3 streams.

434

"""Unpacker for cg3 streams.

431

435

432

cg3 streams add support for exchanging treemanifests and revlog

436

cg3 streams add support for exchanging treemanifests and revlog

433

flags. It adds the revlog flags to the delta header and an empty chunk

437

flags. It adds the revlog flags to the delta header and an empty chunk

434

separating manifests and files.

438

separating manifests and files.

435

"""

439

"""

436

deltaheader = _CHANGEGROUPV3_DELTA_HEADER

440

deltaheader = _CHANGEGROUPV3_DELTA_HEADER

437

deltaheadersize = struct.calcsize(deltaheader)

441

deltaheadersize = struct.calcsize(deltaheader)

438

version = '03'

442

version = '03'

439

_grouplistcount = 2 # One list of manifests and one list of files

443

_grouplistcount = 2 # One list of manifests and one list of files

440

444

441

def _deltaheader(self, headertuple, prevnode):

445

def _deltaheader(self, headertuple, prevnode):

442

node, p1, p2, deltabase, cs, flags = headertuple

446

node, p1, p2, deltabase, cs, flags = headertuple

443

return node, p1, p2, deltabase, cs, flags

447

return node, p1, p2, deltabase, cs, flags

444

448

445

def _unpackmanifests(self, repo, revmap, trp, prog, numchanges):

449

def _unpackmanifests(self, repo, revmap, trp, prog, numchanges):

446

super(cg3unpacker, self)._unpackmanifests(repo, revmap, trp, prog,

450

super(cg3unpacker, self)._unpackmanifests(repo, revmap, trp, prog,

447

numchanges)

451

numchanges)

448

for chunkdata in iter(self.filelogheader, {}):

452

for chunkdata in iter(self.filelogheader, {}):

449

# If we get here, there are directory manifests in the changegroup

453

# If we get here, there are directory manifests in the changegroup

450

d = chunkdata["filename"]

454

d = chunkdata["filename"]

451

repo.ui.debug("adding %s revisions\n" % d)

455

repo.ui.debug("adding %s revisions\n" % d)

452

dirlog = repo.manifestlog._revlog.dirlog(d)

456

dirlog = repo.manifestlog._revlog.dirlog(d)

453

if not dirlog.addgroup(self, revmap, trp):

457

if not dirlog.addgroup(self, revmap, trp):

454

raise error.Abort(_("received dir revlog group is empty"))

458

raise error.Abort(_("received dir revlog group is empty"))

455

459

456

class headerlessfixup(object):

460

class headerlessfixup(object):

457

def __init__(self, fh, h):

461

def __init__(self, fh, h):

458

self._h = h

462

self._h = h

459

self._fh = fh

463

self._fh = fh

460

def read(self, n):

464

def read(self, n):

461

if self._h:

465

if self._h:

462

d, self._h = self._h[:n], self._h[n:]

466

d, self._h = self._h[:n], self._h[n:]

463

if len(d) < n:

467

if len(d) < n:

464

d += readexactly(self._fh, n - len(d))

468

d += readexactly(self._fh, n - len(d))

465

return d

469

return d

466

return readexactly(self._fh, n)

470

return readexactly(self._fh, n)

467

471

468

class cg1packer(object):

472

class cg1packer(object):

469

deltaheader = _CHANGEGROUPV1_DELTA_HEADER

473

deltaheader = _CHANGEGROUPV1_DELTA_HEADER

470

version = '01'

474

version = '01'

471

def __init__(self, repo, bundlecaps=None):

475

def __init__(self, repo, bundlecaps=None):

472

"""Given a source repo, construct a bundler.

476

"""Given a source repo, construct a bundler.

473

477

474

bundlecaps is optional and can be used to specify the set of

478

bundlecaps is optional and can be used to specify the set of

475

capabilities which can be used to build the bundle. While bundlecaps is

479

capabilities which can be used to build the bundle. While bundlecaps is

476

unused in core Mercurial, extensions rely on this feature to communicate

480

unused in core Mercurial, extensions rely on this feature to communicate

477

capabilities to customize the changegroup packer.

481

capabilities to customize the changegroup packer.

478

"""

482

"""

479

# Set of capabilities we can use to build the bundle.

483

# Set of capabilities we can use to build the bundle.

480

if bundlecaps is None:

484

if bundlecaps is None:

481

bundlecaps = set()

485

bundlecaps = set()

482

self._bundlecaps = bundlecaps

486

self._bundlecaps = bundlecaps

483

# experimental config: bundle.reorder

487

# experimental config: bundle.reorder

484

reorder = repo.ui.config('bundle', 'reorder')

488

reorder = repo.ui.config('bundle', 'reorder')

485

if reorder == 'auto':

489

if reorder == 'auto':

486

reorder = None

490

reorder = None

487

else:

491

else:

488

reorder = util.parsebool(reorder)

492

reorder = util.parsebool(reorder)

489

self._repo = repo

493

self._repo = repo

490

self._reorder = reorder

494

self._reorder = reorder

491

self._progress = repo.ui.progress

495

self._progress = repo.ui.progress

492

if self._repo.ui.verbose and not self._repo.ui.debugflag:

496

if self._repo.ui.verbose and not self._repo.ui.debugflag:

493

self._verbosenote = self._repo.ui.note

497

self._verbosenote = self._repo.ui.note

494

else:

498

else:

495

self._verbosenote = lambda s: None

499

self._verbosenote = lambda s: None

496

500

497

def close(self):

501

def close(self):

498

return closechunk()

502

return closechunk()

499

503

500

def fileheader(self, fname):

504

def fileheader(self, fname):

501

return chunkheader(len(fname)) + fname

505

return chunkheader(len(fname)) + fname

502

506

503

# Extracted both for clarity and for overriding in extensions.

507

# Extracted both for clarity and for overriding in extensions.

504

def _sortgroup(self, revlog, nodelist, lookup):

508

def _sortgroup(self, revlog, nodelist, lookup):

505

"""Sort nodes for change group and turn them into revnums."""

509

"""Sort nodes for change group and turn them into revnums."""

506

# for generaldelta revlogs, we linearize the revs; this will both be

510

# for generaldelta revlogs, we linearize the revs; this will both be

507

# much quicker and generate a much smaller bundle

511

# much quicker and generate a much smaller bundle

508

if (revlog._generaldelta and self._reorder is None) or self._reorder:

512

if (revlog._generaldelta and self._reorder is None) or self._reorder:

509

dag = dagutil.revlogdag(revlog)

513

dag = dagutil.revlogdag(revlog)

510

return dag.linearize(set(revlog.rev(n) for n in nodelist))

514

return dag.linearize(set(revlog.rev(n) for n in nodelist))

511

else:

515

else:

512

return sorted([revlog.rev(n) for n in nodelist])

516

return sorted([revlog.rev(n) for n in nodelist])

513

517

514

def group(self, nodelist, revlog, lookup, units=None):

518

def group(self, nodelist, revlog, lookup, units=None):

515

"""Calculate a delta group, yielding a sequence of changegroup chunks

519

"""Calculate a delta group, yielding a sequence of changegroup chunks

516

(strings).

520

(strings).

517

521

518

Given a list of changeset revs, return a set of deltas and

522

Given a list of changeset revs, return a set of deltas and

519

metadata corresponding to nodes. The first delta is

523

metadata corresponding to nodes. The first delta is

520

first parent(nodelist[0]) -> nodelist[0], the receiver is

524

first parent(nodelist[0]) -> nodelist[0], the receiver is

521

guaranteed to have this parent as it has all history before

525

guaranteed to have this parent as it has all history before

522

these changesets. In the case firstparent is nullrev the

526

these changesets. In the case firstparent is nullrev the

523

changegroup starts with a full revision.

527

changegroup starts with a full revision.

524

528

525

If units is not None, progress detail will be generated, units specifies

529

If units is not None, progress detail will be generated, units specifies

526

the type of revlog that is touched (changelog, manifest, etc.).

530

the type of revlog that is touched (changelog, manifest, etc.).

527

"""

531

"""

528

# if we don't have any revisions touched by these changesets, bail

532

# if we don't have any revisions touched by these changesets, bail

529

if len(nodelist) == 0:

533

if len(nodelist) == 0:

530

yield self.close()

534

yield self.close()

531

return

535

return

532

536

533

revs = self._sortgroup(revlog, nodelist, lookup)

537

revs = self._sortgroup(revlog, nodelist, lookup)

534

538

535

# add the parent of the first rev

539

# add the parent of the first rev

536

p = revlog.parentrevs(revs[0])[0]

540

p = revlog.parentrevs(revs[0])[0]

537

revs.insert(0, p)

541

revs.insert(0, p)

538

542

539

# build deltas

543

# build deltas

540

total = len(revs) - 1

544

total = len(revs) - 1

541

msgbundling = _('bundling')

545

msgbundling = _('bundling')

542

for r in xrange(len(revs) - 1):

546

for r in xrange(len(revs) - 1):

543

if units is not None:

547

if units is not None:

544

self._progress(msgbundling, r + 1, unit=units, total=total)

548

self._progress(msgbundling, r + 1, unit=units, total=total)

545

prev, curr = revs[r], revs[r + 1]

549

prev, curr = revs[r], revs[r + 1]

546

linknode = lookup(revlog.node(curr))

550

linknode = lookup(revlog.node(curr))

547

for c in self.revchunk(revlog, curr, prev, linknode):

551

for c in self.revchunk(revlog, curr, prev, linknode):

548

yield c

552

yield c

549

553

550

if units is not None:

554

if units is not None:

551

self._progress(msgbundling, None)

555

self._progress(msgbundling, None)

552

yield self.close()

556

yield self.close()

553

557

554

# filter any nodes that claim to be part of the known set

558

# filter any nodes that claim to be part of the known set

555

def prune(self, revlog, missing, commonrevs):

559

def prune(self, revlog, missing, commonrevs):

556

rr, rl = revlog.rev, revlog.linkrev

560

rr, rl = revlog.rev, revlog.linkrev

557

return [n for n in missing if rl(rr(n)) not in commonrevs]

561

return [n for n in missing if rl(rr(n)) not in commonrevs]

558

562

559

def _packmanifests(self, dir, mfnodes, lookuplinknode):

563

def _packmanifests(self, dir, mfnodes, lookuplinknode):

560

"""Pack flat manifests into a changegroup stream."""

564

"""Pack flat manifests into a changegroup stream."""

561

assert not dir

565

assert not dir

562

for chunk in self.group(mfnodes, self._repo.manifestlog._revlog,

566

for chunk in self.group(mfnodes, self._repo.manifestlog._revlog,

563

lookuplinknode, units=_('manifests')):

567

lookuplinknode, units=_('manifests')):

564

yield chunk

568

yield chunk

565

569

566

def _manifestsdone(self):

570

def _manifestsdone(self):

567

return ''

571

return ''

568

572

569

def generate(self, commonrevs, clnodes, fastpathlinkrev, source):

573

def generate(self, commonrevs, clnodes, fastpathlinkrev, source):

570

'''yield a sequence of changegroup chunks (strings)'''

574

'''yield a sequence of changegroup chunks (strings)'''

571

repo = self._repo

575

repo = self._repo

572

cl = repo.changelog

576

cl = repo.changelog

573

577

574

clrevorder = {}

578

clrevorder = {}

575

mfs = {} # needed manifests

579

mfs = {} # needed manifests

576

fnodes = {} # needed file nodes

580

fnodes = {} # needed file nodes

577

changedfiles = set()

581

changedfiles = set()

578

582

579

# Callback for the changelog, used to collect changed files and manifest

583

# Callback for the changelog, used to collect changed files and manifest

580

# nodes.

584

# nodes.

581

# Returns the linkrev node (identity in the changelog case).

585

# Returns the linkrev node (identity in the changelog case).

582

def lookupcl(x):

586

def lookupcl(x):

583

c = cl.read(x)

587

c = cl.read(x)

584

clrevorder[x] = len(clrevorder)

588

clrevorder[x] = len(clrevorder)

585

n = c[0]

589

n = c[0]

586

# record the first changeset introducing this manifest version

590

# record the first changeset introducing this manifest version

587

mfs.setdefault(n, x)

591

mfs.setdefault(n, x)

588

# Record a complete list of potentially-changed files in

592

# Record a complete list of potentially-changed files in

589

# this manifest.

593

# this manifest.

590

changedfiles.update(c[3])

594

changedfiles.update(c[3])

591

return x

595

return x

592

596

593

self._verbosenote(_('uncompressed size of bundle content:\n'))

597

self._verbosenote(_('uncompressed size of bundle content:\n'))

594

size = 0

598

size = 0

595

for chunk in self.group(clnodes, cl, lookupcl, units=_('changesets')):

599

for chunk in self.group(clnodes, cl, lookupcl, units=_('changesets')):

596

size += len(chunk)

600

size += len(chunk)

597

yield chunk

601

yield chunk

598

self._verbosenote(_('%8.i (changelog)\n') % size)

602

self._verbosenote(_('%8.i (changelog)\n') % size)

599

603

600

# We need to make sure that the linkrev in the changegroup refers to

604

# We need to make sure that the linkrev in the changegroup refers to

601

# the first changeset that introduced the manifest or file revision.

605

# the first changeset that introduced the manifest or file revision.

602

# The fastpath is usually safer than the slowpath, because the filelogs

606

# The fastpath is usually safer than the slowpath, because the filelogs

603

# are walked in revlog order.

607

# are walked in revlog order.

604

#

608

#

605

# When taking the slowpath with reorder=None and the manifest revlog

609

# When taking the slowpath with reorder=None and the manifest revlog

606

# uses generaldelta, the manifest may be walked in the "wrong" order.

610

# uses generaldelta, the manifest may be walked in the "wrong" order.

607

# Without 'clrevorder', we would get an incorrect linkrev (see fix in

611

# Without 'clrevorder', we would get an incorrect linkrev (see fix in

608

# cc0ff93d0c0c).

612

# cc0ff93d0c0c).

609

#

613

#

610

# When taking the fastpath, we are only vulnerable to reordering

614

# When taking the fastpath, we are only vulnerable to reordering

611

# of the changelog itself. The changelog never uses generaldelta, so

615

# of the changelog itself. The changelog never uses generaldelta, so

612

# it is only reordered when reorder=True. To handle this case, we

616

# it is only reordered when reorder=True. To handle this case, we

613

# simply take the slowpath, which already has the 'clrevorder' logic.

617

# simply take the slowpath, which already has the 'clrevorder' logic.

614

# This was also fixed in cc0ff93d0c0c.

618

# This was also fixed in cc0ff93d0c0c.

615

fastpathlinkrev = fastpathlinkrev and not self._reorder

619

fastpathlinkrev = fastpathlinkrev and not self._reorder

616

# Treemanifests don't work correctly with fastpathlinkrev

620

# Treemanifests don't work correctly with fastpathlinkrev

617

# either, because we don't discover which directory nodes to

621

# either, because we don't discover which directory nodes to

618

# send along with files. This could probably be fixed.

622

# send along with files. This could probably be fixed.

619

fastpathlinkrev = fastpathlinkrev and (

623

fastpathlinkrev = fastpathlinkrev and (

620

'treemanifest' not in repo.requirements)

624

'treemanifest' not in repo.requirements)

621

625

622

for chunk in self.generatemanifests(commonrevs, clrevorder,

626

for chunk in self.generatemanifests(commonrevs, clrevorder,

623

fastpathlinkrev, mfs, fnodes):

627

fastpathlinkrev, mfs, fnodes):

624

yield chunk

628

yield chunk

625

mfs.clear()

629

mfs.clear()

626

clrevs = set(cl.rev(x) for x in clnodes)

630

clrevs = set(cl.rev(x) for x in clnodes)

627

631

628

if not fastpathlinkrev:

632

if not fastpathlinkrev:

629

def linknodes(unused, fname):

633

def linknodes(unused, fname):

630

return fnodes.get(fname, {})

634

return fnodes.get(fname, {})

631

else:

635

else:

632

cln = cl.node

636

cln = cl.node

633

def linknodes(filerevlog, fname):

637

def linknodes(filerevlog, fname):

634

llr = filerevlog.linkrev

638

llr = filerevlog.linkrev

635

fln = filerevlog.node

639

fln = filerevlog.node

636

revs = ((r, llr(r)) for r in filerevlog)

640

revs = ((r, llr(r)) for r in filerevlog)

637

return dict((fln(r), cln(lr)) for r, lr in revs if lr in clrevs)

641

return dict((fln(r), cln(lr)) for r, lr in revs if lr in clrevs)

638

642

639

for chunk in self.generatefiles(changedfiles, linknodes, commonrevs,

643

for chunk in self.generatefiles(changedfiles, linknodes, commonrevs,

640

source):

644

source):

641

yield chunk

645

yield chunk

642

646

643

yield self.close()

647

yield self.close()

644

648

645

if clnodes:

649

if clnodes:

646

repo.hook('outgoing', node=hex(clnodes[0]), source=source)

650

repo.hook('outgoing', node=hex(clnodes[0]), source=source)

647

651

648

def generatemanifests(self, commonrevs, clrevorder, fastpathlinkrev, mfs,

652

def generatemanifests(self, commonrevs, clrevorder, fastpathlinkrev, mfs,

649

fnodes):

653

fnodes):

650

repo = self._repo

654

repo = self._repo

651

mfl = repo.manifestlog

655

mfl = repo.manifestlog

652

dirlog = mfl._revlog.dirlog

656

dirlog = mfl._revlog.dirlog

653

tmfnodes = {'': mfs}

657

tmfnodes = {'': mfs}

654

658

655

# Callback for the manifest, used to collect linkrevs for filelog

659

# Callback for the manifest, used to collect linkrevs for filelog

656

# revisions.

660

# revisions.

657

# Returns the linkrev node (collected in lookupcl).

661

# Returns the linkrev node (collected in lookupcl).

658

def makelookupmflinknode(dir):

662

def makelookupmflinknode(dir):

659

if fastpathlinkrev:

663

if fastpathlinkrev:

660

assert not dir

664

assert not dir

661

return mfs.__getitem__

665

return mfs.__getitem__

662

666

663

def lookupmflinknode(x):

667

def lookupmflinknode(x):

664

"""Callback for looking up the linknode for manifests.

668

"""Callback for looking up the linknode for manifests.

665

669

666

Returns the linkrev node for the specified manifest.

670

Returns the linkrev node for the specified manifest.

667

671

668

SIDE EFFECT:

672

SIDE EFFECT:

669

673

670

1) fclnodes gets populated with the list of relevant

674

1) fclnodes gets populated with the list of relevant

671

file nodes if we're not using fastpathlinkrev

675

file nodes if we're not using fastpathlinkrev

672

2) When treemanifests are in use, collects treemanifest nodes

676

2) When treemanifests are in use, collects treemanifest nodes

673

to send

677

to send

674

678

675

Note that this means manifests must be completely sent to

679

Note that this means manifests must be completely sent to

676

the client before you can trust the list of files and

680

the client before you can trust the list of files and

677

treemanifests to send.

681

treemanifests to send.

678

"""

682

"""

679

clnode = tmfnodes[dir][x]

683

clnode = tmfnodes[dir][x]

680

mdata = mfl.get(dir, x).readfast(shallow=True)

684

mdata = mfl.get(dir, x).readfast(shallow=True)

681

for p, n, fl in mdata.iterentries():

685

for p, n, fl in mdata.iterentries():

682

if fl == 't': # subdirectory manifest

686

if fl == 't': # subdirectory manifest

683

subdir = dir + p + '/'

687

subdir = dir + p + '/'

684

tmfclnodes = tmfnodes.setdefault(subdir, {})

688

tmfclnodes = tmfnodes.setdefault(subdir, {})

685

tmfclnode = tmfclnodes.setdefault(n, clnode)

689

tmfclnode = tmfclnodes.setdefault(n, clnode)

686

if clrevorder[clnode] < clrevorder[tmfclnode]:

690

if clrevorder[clnode] < clrevorder[tmfclnode]:

687

tmfclnodes[n] = clnode

691

tmfclnodes[n] = clnode

688

else:

692

else:

689

f = dir + p

693

f = dir + p

690

fclnodes = fnodes.setdefault(f, {})

694

fclnodes = fnodes.setdefault(f, {})

691

fclnode = fclnodes.setdefault(n, clnode)

695

fclnode = fclnodes.setdefault(n, clnode)

692

if clrevorder[clnode] < clrevorder[fclnode]:

696

if clrevorder[clnode] < clrevorder[fclnode]:

693

fclnodes[n] = clnode

697

fclnodes[n] = clnode

694

return clnode

698

return clnode

695

return lookupmflinknode

699

return lookupmflinknode

696

700

697

size = 0

701

size = 0

698

while tmfnodes:

702

while tmfnodes:

699

dir = min(tmfnodes)

703

dir = min(tmfnodes)

700

nodes = tmfnodes[dir]

704

nodes = tmfnodes[dir]

701

prunednodes = self.prune(dirlog(dir), nodes, commonrevs)

705

prunednodes = self.prune(dirlog(dir), nodes, commonrevs)

702

if not dir or prunednodes:

706

if not dir or prunednodes:

703

for x in self._packmanifests(dir, prunednodes,

707

for x in self._packmanifests(dir, prunednodes,

704

makelookupmflinknode(dir)):

708

makelookupmflinknode(dir)):

705

size += len(x)

709

size += len(x)

706

yield x

710

yield x

707

del tmfnodes[dir]

711

del tmfnodes[dir]

708

self._verbosenote(_('%8.i (manifests)\n') % size)

712

self._verbosenote(_('%8.i (manifests)\n') % size)

709

yield self._manifestsdone()

713

yield self._manifestsdone()

710

714

711

# The 'source' parameter is useful for extensions

715

# The 'source' parameter is useful for extensions

712

def generatefiles(self, changedfiles, linknodes, commonrevs, source):

716

def generatefiles(self, changedfiles, linknodes, commonrevs, source):

713

repo = self._repo

717

repo = self._repo

714

progress = self._progress

718

progress = self._progress

715

msgbundling = _('bundling')

719

msgbundling = _('bundling')

716

720

717

total = len(changedfiles)

721

total = len(changedfiles)

718

# for progress output

722

# for progress output

719

msgfiles = _('files')

723

msgfiles = _('files')

720

for i, fname in enumerate(sorted(changedfiles)):

724

for i, fname in enumerate(sorted(changedfiles)):

721

filerevlog = repo.file(fname)

725

filerevlog = repo.file(fname)

722

if not filerevlog:

726

if not filerevlog:

723

raise error.Abort(_("empty or missing revlog for %s") % fname)

727

raise error.Abort(_("empty or missing revlog for %s") % fname)

724

728

725

linkrevnodes = linknodes(filerevlog, fname)

729

linkrevnodes = linknodes(filerevlog, fname)

726

# Lookup for filenodes, we collected the linkrev nodes above in the

730

# Lookup for filenodes, we collected the linkrev nodes above in the

727

# fastpath case and with lookupmf in the slowpath case.

731

# fastpath case and with lookupmf in the slowpath case.

728

def lookupfilelog(x):

732

def lookupfilelog(x):

729

return linkrevnodes[x]

733

return linkrevnodes[x]

730

734

731

filenodes = self.prune(filerevlog, linkrevnodes, commonrevs)

735

filenodes = self.prune(filerevlog, linkrevnodes, commonrevs)

732

if filenodes:

736

if filenodes:

733

progress(msgbundling, i + 1, item=fname, unit=msgfiles,

737

progress(msgbundling, i + 1, item=fname, unit=msgfiles,

734

total=total)

738

total=total)

735

h = self.fileheader(fname)

739

h = self.fileheader(fname)

736

size = len(h)

740

size = len(h)

737

yield h

741

yield h

738

for chunk in self.group(filenodes, filerevlog, lookupfilelog):

742

for chunk in self.group(filenodes, filerevlog, lookupfilelog):

739

size += len(chunk)

743

size += len(chunk)

740

yield chunk

744

yield chunk

741

self._verbosenote(_('%8.i %s\n') % (size, fname))

745

self._verbosenote(_('%8.i %s\n') % (size, fname))

742

progress(msgbundling, None)

746

progress(msgbundling, None)

743

747

744

def deltaparent(self, revlog, rev, p1, p2, prev):

748

def deltaparent(self, revlog, rev, p1, p2, prev):

745

return prev

749

return prev

746

750

747

def revchunk(self, revlog, rev, prev, linknode):

751

def revchunk(self, revlog, rev, prev, linknode):

748

node = revlog.node(rev)

752

node = revlog.node(rev)

749

p1, p2 = revlog.parentrevs(rev)

753

p1, p2 = revlog.parentrevs(rev)

750

base = self.deltaparent(revlog, rev, p1, p2, prev)

754

base = self.deltaparent(revlog, rev, p1, p2, prev)

751

755

752

prefix = ''

756

prefix = ''

753

if revlog.iscensored(base) or revlog.iscensored(rev):

757

if revlog.iscensored(base) or revlog.iscensored(rev):

754

try:

758

try:

755

delta = revlog.revision(node, raw=True)

759

delta = revlog.revision(node, raw=True)

756

except error.CensoredNodeError as e:

760

except error.CensoredNodeError as e:

757

delta = e.tombstone

761

delta = e.tombstone

758

if base == nullrev:

762

if base == nullrev:

759

prefix = mdiff.trivialdiffheader(len(delta))

763

prefix = mdiff.trivialdiffheader(len(delta))

760

else:

764

else:

761

baselen = revlog.rawsize(base)

765

baselen = revlog.rawsize(base)

762

prefix = mdiff.replacediffheader(baselen, len(delta))

766

prefix = mdiff.replacediffheader(baselen, len(delta))

763

elif base == nullrev:

767

elif base == nullrev:

764

delta = revlog.revision(node, raw=True)

768

delta = revlog.revision(node, raw=True)

765

prefix = mdiff.trivialdiffheader(len(delta))

769

prefix = mdiff.trivialdiffheader(len(delta))

766

else:

770

else:

767

delta = revlog.revdiff(base, rev)

771

delta = revlog.revdiff(base, rev)

768

p1n, p2n = revlog.parents(node)

772

p1n, p2n = revlog.parents(node)

769

basenode = revlog.node(base)

773

basenode = revlog.node(base)

770

flags = revlog.flags(rev)

774

flags = revlog.flags(rev)

771

meta = self.builddeltaheader(node, p1n, p2n, basenode, linknode, flags)

775

meta = self.builddeltaheader(node, p1n, p2n, basenode, linknode, flags)

772

meta += prefix

776

meta += prefix

773

l = len(meta) + len(delta)

777

l = len(meta) + len(delta)

774

yield chunkheader(l)

778

yield chunkheader(l)

775

yield meta

779

yield meta

776

yield delta

780

yield delta

777

def builddeltaheader(self, node, p1n, p2n, basenode, linknode, flags):

781

def builddeltaheader(self, node, p1n, p2n, basenode, linknode, flags):

778

# do nothing with basenode, it is implicitly the previous one in HG10

782

# do nothing with basenode, it is implicitly the previous one in HG10

779

# do nothing with flags, it is implicitly 0 for cg1 and cg2

783

# do nothing with flags, it is implicitly 0 for cg1 and cg2

780

return struct.pack(self.deltaheader, node, p1n, p2n, linknode)

784

return struct.pack(self.deltaheader, node, p1n, p2n, linknode)

781

785

782

class cg2packer(cg1packer):

786

class cg2packer(cg1packer):

783

version = '02'

787

version = '02'

784

deltaheader = _CHANGEGROUPV2_DELTA_HEADER

788

deltaheader = _CHANGEGROUPV2_DELTA_HEADER

785

789

786

def __init__(self, repo, bundlecaps=None):

790

def __init__(self, repo, bundlecaps=None):

787

super(cg2packer, self).__init__(repo, bundlecaps)

791

super(cg2packer, self).__init__(repo, bundlecaps)

788

if self._reorder is None:

792

if self._reorder is None:

789

# Since generaldelta is directly supported by cg2, reordering

793

# Since generaldelta is directly supported by cg2, reordering

790

# generally doesn't help, so we disable it by default (treating

794

# generally doesn't help, so we disable it by default (treating

791

# bundle.reorder=auto just like bundle.reorder=False).

795

# bundle.reorder=auto just like bundle.reorder=False).

792

self._reorder = False

796

self._reorder = False

793

797

794

def deltaparent(self, revlog, rev, p1, p2, prev):

798

def deltaparent(self, revlog, rev, p1, p2, prev):

795

dp = revlog.deltaparent(rev)

799

dp = revlog.deltaparent(rev)

796

if dp == nullrev and revlog.storedeltachains:

800

if dp == nullrev and revlog.storedeltachains:

797

# Avoid sending full revisions when delta parent is null. Pick prev

801

# Avoid sending full revisions when delta parent is null. Pick prev

798

# in that case. It's tempting to pick p1 in this case, as p1 will

802

# in that case. It's tempting to pick p1 in this case, as p1 will

799

# be smaller in the common case. However, computing a delta against

803

# be smaller in the common case. However, computing a delta against

800

# p1 may require resolving the raw text of p1, which could be

804

# p1 may require resolving the raw text of p1, which could be

801

# expensive. The revlog caches should have prev cached, meaning

805

# expensive. The revlog caches should have prev cached, meaning

802

# less CPU for changegroup generation. There is likely room to add

806

# less CPU for changegroup generation. There is likely room to add

803

# a flag and/or config option to control this behavior.

807

# a flag and/or config option to control this behavior.

804

return prev

808

return prev

805

elif dp == nullrev:

809

elif dp == nullrev:

806

# revlog is configured to use full snapshot for a reason,

810

# revlog is configured to use full snapshot for a reason,

807

# stick to full snapshot.

811

# stick to full snapshot.

808

return nullrev

812

return nullrev

809

elif dp not in (p1, p2, prev):

813

elif dp not in (p1, p2, prev):

810

# Pick prev when we can't be sure remote has the base revision.

814

# Pick prev when we can't be sure remote has the base revision.

811

return prev

815

return prev

812

else:

816

else:

813

return dp

817

return dp

814

818

815

def builddeltaheader(self, node, p1n, p2n, basenode, linknode, flags):

819

def builddeltaheader(self, node, p1n, p2n, basenode, linknode, flags):

816

# Do nothing with flags, it is implicitly 0 in cg1 and cg2

820

# Do nothing with flags, it is implicitly 0 in cg1 and cg2

817

return struct.pack(self.deltaheader, node, p1n, p2n, basenode, linknode)

821

return struct.pack(self.deltaheader, node, p1n, p2n, basenode, linknode)

818

822

819

class cg3packer(cg2packer):

823

class cg3packer(cg2packer):

820

version = '03'

824

version = '03'

821

deltaheader = _CHANGEGROUPV3_DELTA_HEADER

825

deltaheader = _CHANGEGROUPV3_DELTA_HEADER

822

826

823

def _packmanifests(self, dir, mfnodes, lookuplinknode):

827

def _packmanifests(self, dir, mfnodes, lookuplinknode):

824

if dir:

828

if dir:

825

yield self.fileheader(dir)

829

yield self.fileheader(dir)

826

830

827

dirlog = self._repo.manifestlog._revlog.dirlog(dir)

831

dirlog = self._repo.manifestlog._revlog.dirlog(dir)

828

for chunk in self.group(mfnodes, dirlog, lookuplinknode,

832

for chunk in self.group(mfnodes, dirlog, lookuplinknode,

829

units=_('manifests')):

833

units=_('manifests')):

830

yield chunk

834

yield chunk

831

835

832

def _manifestsdone(self):

836

def _manifestsdone(self):

833

return self.close()

837

return self.close()

834

838

835

def builddeltaheader(self, node, p1n, p2n, basenode, linknode, flags):

839

def builddeltaheader(self, node, p1n, p2n, basenode, linknode, flags):

836

return struct.pack(

840

return struct.pack(

837

self.deltaheader, node, p1n, p2n, basenode, linknode, flags)

841

self.deltaheader, node, p1n, p2n, basenode, linknode, flags)

838

842

839

_packermap = {'01': (cg1packer, cg1unpacker),

843

_packermap = {'01': (cg1packer, cg1unpacker),

840

# cg2 adds support for exchanging generaldelta

844

# cg2 adds support for exchanging generaldelta

841

'02': (cg2packer, cg2unpacker),

845

'02': (cg2packer, cg2unpacker),

842

# cg3 adds support for exchanging revlog flags and treemanifests

846

# cg3 adds support for exchanging revlog flags and treemanifests

843

'03': (cg3packer, cg3unpacker),

847

'03': (cg3packer, cg3unpacker),

844

}

848

}

845

849

846

def allsupportedversions(repo):

850

def allsupportedversions(repo):

847

versions = set(_packermap.keys())

851

versions = set(_packermap.keys())

848

if not (repo.ui.configbool('experimental', 'changegroup3') or

852

if not (repo.ui.configbool('experimental', 'changegroup3') or

849

repo.ui.configbool('experimental', 'treemanifest') or

853

repo.ui.configbool('experimental', 'treemanifest') or

850

'treemanifest' in repo.requirements):

854

'treemanifest' in repo.requirements):

851

versions.discard('03')

855

versions.discard('03')

852

return versions

856

return versions

853

857

854

# Changegroup versions that can be applied to the repo

858

# Changegroup versions that can be applied to the repo

855

def supportedincomingversions(repo):

859

def supportedincomingversions(repo):

856

return allsupportedversions(repo)

860

return allsupportedversions(repo)

857

861

858

# Changegroup versions that can be created from the repo

862

# Changegroup versions that can be created from the repo

859

def supportedoutgoingversions(repo):

863

def supportedoutgoingversions(repo):

860

versions = allsupportedversions(repo)

864

versions = allsupportedversions(repo)

861

if 'treemanifest' in repo.requirements:

865

if 'treemanifest' in repo.requirements:

862

# Versions 01 and 02 support only flat manifests and it's just too

866

# Versions 01 and 02 support only flat manifests and it's just too

863

# expensive to convert between the flat manifest and tree manifest on

867

# expensive to convert between the flat manifest and tree manifest on

864

# the fly. Since tree manifests are hashed differently, all of history

868

# the fly. Since tree manifests are hashed differently, all of history

865

# would have to be converted. Instead, we simply don't even pretend to

869

# would have to be converted. Instead, we simply don't even pretend to

866

# support versions 01 and 02.

870

# support versions 01 and 02.

867

versions.discard('01')

871

versions.discard('01')

868

versions.discard('02')

872

versions.discard('02')

869

return versions

873

return versions

870

874

871

def safeversion(repo):

875

def safeversion(repo):

872

# Finds the smallest version that it's safe to assume clients of the repo

876

# Finds the smallest version that it's safe to assume clients of the repo

873

# will support. For example, all hg versions that support generaldelta also

877

# will support. For example, all hg versions that support generaldelta also

874

# support changegroup 02.

878

# support changegroup 02.

875

versions = supportedoutgoingversions(repo)

879

versions = supportedoutgoingversions(repo)

876

if 'generaldelta' in repo.requirements:

880

if 'generaldelta' in repo.requirements:

877

versions.discard('01')

881

versions.discard('01')

878

assert versions

882

assert versions

879

return min(versions)

883

return min(versions)

880

884

881

def getbundler(version, repo, bundlecaps=None):

885

def getbundler(version, repo, bundlecaps=None):

882

assert version in supportedoutgoingversions(repo)

886

assert version in supportedoutgoingversions(repo)

883

return _packermap[version][0](repo, bundlecaps)

887

return _packermap[version][0](repo, bundlecaps)

884

888

885

def getunbundler(version, fh, alg, extras=None):

889

def getunbundler(version, fh, alg, extras=None):

886

return _packermap[version][1](fh, alg, extras=extras)

890

return _packermap[version][1](fh, alg, extras=extras)

887

891

888

def _changegroupinfo(repo, nodes, source):

892

def _changegroupinfo(repo, nodes, source):

889

if repo.ui.verbose or source == 'bundle':

893

if repo.ui.verbose or source == 'bundle':

890

repo.ui.status(_("%d changesets found\n") % len(nodes))

894

repo.ui.status(_("%d changesets found\n") % len(nodes))

891

if repo.ui.debugflag:

895

if repo.ui.debugflag:

892

repo.ui.debug("list of changesets:\n")

896

repo.ui.debug("list of changesets:\n")

893

for node in nodes:

897

for node in nodes:

894

repo.ui.debug("%s\n" % hex(node))

898

repo.ui.debug("%s\n" % hex(node))

895

899

896

def getsubsetraw(repo, outgoing, bundler, source, fastpath=False):

900

def getsubsetraw(repo, outgoing, bundler, source, fastpath=False):

897

repo = repo.unfiltered()

901

repo = repo.unfiltered()

898

commonrevs = outgoing.common

902

commonrevs = outgoing.common

899

csets = outgoing.missing

903

csets = outgoing.missing

900

heads = outgoing.missingheads

904

heads = outgoing.missingheads

901

# We go through the fast path if we get told to, or if all (unfiltered

905

# We go through the fast path if we get told to, or if all (unfiltered

902

# heads have been requested (since we then know there all linkrevs will

906

# heads have been requested (since we then know there all linkrevs will

903

# be pulled by the client).

907

# be pulled by the client).

904

heads.sort()

908

heads.sort()

905

fastpathlinkrev = fastpath or (

909

fastpathlinkrev = fastpath or (

906

repo.filtername is None and heads == sorted(repo.heads()))

910

repo.filtername is None and heads == sorted(repo.heads()))

907

911

908

repo.hook('preoutgoing', throw=True, source=source)

912

repo.hook('preoutgoing', throw=True, source=source)

909

_changegroupinfo(repo, csets, source)

913

_changegroupinfo(repo, csets, source)

910

return bundler.generate(commonrevs, csets, fastpathlinkrev, source)

914

return bundler.generate(commonrevs, csets, fastpathlinkrev, source)

911

915

912

def getsubset(repo, outgoing, bundler, source, fastpath=False):

916

def getsubset(repo, outgoing, bundler, source, fastpath=False):

913

gengroup = getsubsetraw(repo, outgoing, bundler, source, fastpath)

917

gengroup = getsubsetraw(repo, outgoing, bundler, source, fastpath)

914

return getunbundler(bundler.version, util.chunkbuffer(gengroup), None,

918

return getunbundler(bundler.version, util.chunkbuffer(gengroup), None,

915

{'clcount': len(outgoing.missing)})

919

{'clcount': len(outgoing.missing)})

916

920

917

def changegroupsubset(repo, roots, heads, source, version='01'):

921

def changegroupsubset(repo, roots, heads, source, version='01'):

918

"""Compute a changegroup consisting of all the nodes that are

922

"""Compute a changegroup consisting of all the nodes that are

919

descendants of any of the roots and ancestors of any of the heads.

923

descendants of any of the roots and ancestors of any of the heads.

920

Return a chunkbuffer object whose read() method will return

924

Return a chunkbuffer object whose read() method will return

921

successive changegroup chunks.

925

successive changegroup chunks.

922

926

923

It is fairly complex as determining which filenodes and which

927

It is fairly complex as determining which filenodes and which

924

manifest nodes need to be included for the changeset to be complete

928

manifest nodes need to be included for the changeset to be complete

925

is non-trivial.

929

is non-trivial.

926

930

927

Another wrinkle is doing the reverse, figuring out which changeset in

931

Another wrinkle is doing the reverse, figuring out which changeset in

928

the changegroup a particular filenode or manifestnode belongs to.

932

the changegroup a particular filenode or manifestnode belongs to.

929

"""

933

"""

930

outgoing = discovery.outgoing(repo, missingroots=roots, missingheads=heads)

934

outgoing = discovery.outgoing(repo, missingroots=roots, missingheads=heads)

931

bundler = getbundler(version, repo)

935

bundler = getbundler(version, repo)

932

return getsubset(repo, outgoing, bundler, source)

936

return getsubset(repo, outgoing, bundler, source)

933

937

934

def getlocalchangegroupraw(repo, source, outgoing, bundlecaps=None,

938

def getlocalchangegroupraw(repo, source, outgoing, bundlecaps=None,

935

version='01'):

939

version='01'):

936

"""Like getbundle, but taking a discovery.outgoing as an argument.

940

"""Like getbundle, but taking a discovery.outgoing as an argument.

937

941

938

This is only implemented for local repos and reuses potentially

942

This is only implemented for local repos and reuses potentially

939

precomputed sets in outgoing. Returns a raw changegroup generator."""

943

precomputed sets in outgoing. Returns a raw changegroup generator."""

940

if not outgoing.missing:

944

if not outgoing.missing:

941

return None

945

return None

942

bundler = getbundler(version, repo, bundlecaps)

946

bundler = getbundler(version, repo, bundlecaps)

943

return getsubsetraw(repo, outgoing, bundler, source)

947

return getsubsetraw(repo, outgoing, bundler, source)

944

948

945

def getchangegroup(repo, source, outgoing, bundlecaps=None,

949

def getchangegroup(repo, source, outgoing, bundlecaps=None,

946

version='01'):

950

version='01'):

947

"""Like getbundle, but taking a discovery.outgoing as an argument.

951

"""Like getbundle, but taking a discovery.outgoing as an argument.

948

952

949

This is only implemented for local repos and reuses potentially

953

This is only implemented for local repos and reuses potentially

950

precomputed sets in outgoing."""

954

precomputed sets in outgoing."""

951

if not outgoing.missing:

955

if not outgoing.missing:

952

return None

956

return None

953

bundler = getbundler(version, repo, bundlecaps)

957

bundler = getbundler(version, repo, bundlecaps)

954

return getsubset(repo, outgoing, bundler, source)

958

return getsubset(repo, outgoing, bundler, source)

955

959

956

def getlocalchangegroup(repo, *args, **kwargs):

960

def getlocalchangegroup(repo, *args, **kwargs):

957

repo.ui.deprecwarn('getlocalchangegroup is deprecated, use getchangegroup',

961

repo.ui.deprecwarn('getlocalchangegroup is deprecated, use getchangegroup',

958

'4.3')

962

'4.3')

959

return getchangegroup(repo, *args, **kwargs)

963

return getchangegroup(repo, *args, **kwargs)

960

964

961

def changegroup(repo, basenodes, source):

965

def changegroup(repo, basenodes, source):

962

# to avoid a race we use changegroupsubset() (issue1320)

966

# to avoid a race we use changegroupsubset() (issue1320)

963

return changegroupsubset(repo, basenodes, repo.heads(), source)

967

return changegroupsubset(repo, basenodes, repo.heads(), source)

964

968

965

def _addchangegroupfiles(repo, source, revmap, trp, expectedfiles, needfiles):

969

def _addchangegroupfiles(repo, source, revmap, trp, expectedfiles, needfiles):

966

revisions = 0

970

revisions = 0

967

files = 0

971

files = 0

968

for chunkdata in iter(source.filelogheader, {}):

972

for chunkdata in iter(source.filelogheader, {}):

969

files += 1

973

files += 1

970

f = chunkdata["filename"]

974

f = chunkdata["filename"]

971

repo.ui.debug("adding %s revisions\n" % f)

975

repo.ui.debug("adding %s revisions\n" % f)

972

repo.ui.progress(_('files'), files, unit=_('files'),

976

repo.ui.progress(_('files'), files, unit=_('files'),

973

total=expectedfiles)

977

total=expectedfiles)

974

fl = repo.file(f)

978

fl = repo.file(f)

975

o = len(fl)

979

o = len(fl)

976

try:

980

try:

977

if not fl.addgroup(source, revmap, trp):

981

if not fl.addgroup(source, revmap, trp):

978

raise error.Abort(_("received file revlog group is empty"))

982

raise error.Abort(_("received file revlog group is empty"))

979

except error.CensoredBaseError as e:

983

except error.CensoredBaseError as e:

980

raise error.Abort(_("received delta base is censored: %s") % e)

984

raise error.Abort(_("received delta base is censored: %s") % e)

981

revisions += len(fl) - o

985

revisions += len(fl) - o

982

if f in needfiles:

986

if f in needfiles:

983

needs = needfiles[f]

987

needs = needfiles[f]

984

for new in xrange(o, len(fl)):

988

for new in xrange(o, len(fl)):

985

n = fl.node(new)

989

n = fl.node(new)

986

if n in needs:

990

if n in needs:

987

needs.remove(n)

991

needs.remove(n)

988

else:

992

else:

989

raise error.Abort(

993

raise error.Abort(

990

_("received spurious file revlog entry"))

994

_("received spurious file revlog entry"))

991

if not needs:

995

if not needs:

992

del needfiles[f]

996

del needfiles[f]

993

repo.ui.progress(_('files'), None)

997

repo.ui.progress(_('files'), None)

994

998

995

for f, needs in needfiles.iteritems():

999

for f, needs in needfiles.iteritems():

996

fl = repo.file(f)

1000

fl = repo.file(f)

997

for n in needs:

1001

for n in needs:

998

try:

1002

try:

999

fl.rev(n)

1003

fl.rev(n)

1000

except error.LookupError:

1004

except error.LookupError:

1001

raise error.Abort(

1005

raise error.Abort(

1002

_('missing file data for %s:%s - run hg verify') %

1006

_('missing file data for %s:%s - run hg verify') %

1003

(f, hex(n)))

1007

(f, hex(n)))

1004

1008

1005

return revisions, files

1009

return revisions, files

	Site-wide shortcuts
/	Use quick search box
g h	Goto home page
g g	Goto my private gists page
g G	Goto my public gists page
g 0-9	Goto bookmarked items from 0-9
n r	New repository page
n g	New gist page

	Repositories
g s	Goto summary page
g c	Goto changelog page
g f	Goto files page
g F	Goto files page with file search activated
g p	Goto pull requests page
g o	Goto repository settings
g O	Goto repository access permissions settings
t s	Toggle sidebar on some pages

             # changegroup.py - Mercurial changegroup manipulation functions
             #
             #  Copyright 2006 Matt Mackall <mpm@selenic.com>
             #
             # This software may be used and distributed according to the terms of the
             # GNU General Public License version 2 or any later version.
             from __future__ import absolute_import
             import os
             import struct
             import tempfile
             import weakref
             from .i18n import _
             from .node import (
                 hex,
                 nullrev,
                 short,
             )
             from . import (
                 dagutil,
                 discovery,
                 error,
                 mdiff,
                 phases,
                 pycompat,
                 util,
             )
             _CHANGEGROUPV1_DELTA_HEADER = "20s20s20s20s"
             _CHANGEGROUPV2_DELTA_HEADER = "20s20s20s20s20s"
             _CHANGEGROUPV3_DELTA_HEADER = ">20s20s20s20s20sH"
             def readexactly(stream, n):
                 '''read n bytes from stream.read and abort if less was available'''
                 s = stream.read(n)
                 if len(s) < n:
                     raise error.Abort(_("stream ended unexpectedly"
                                        " (got %d bytes, expected %d)")
                                       % (len(s), n))
                 return s
             def getchunk(stream):
                 """return the next chunk from stream as a string"""
                 d = readexactly(stream, 4)
                 l = struct.unpack(">l", d)[0]
                 if l <= 4:
                     if l:
                         raise error.Abort(_("invalid chunk length %d") % l)
                     return ""
                 return readexactly(stream, l - 4)
             def chunkheader(length):
                 """return a changegroup chunk header (string)"""
                 return struct.pack(">l", length + 4)
             def closechunk():
                 """return a changegroup chunk header (string) for a zero-length chunk"""
                 return struct.pack(">l", 0)
             def writechunks(ui, chunks, filename, vfs=None):
                 """Write chunks to a file and return its filename.
                 The stream is assumed to be a bundle file.
                 Existing files will not be overwritten.
                 If no filename is specified, a temporary file is created.
                 """
                 fh = None
                 cleanup = None
                 try:
                     if filename:
                         if vfs:
                             fh = vfs.open(filename, "wb")
                         else:
                             # Increase default buffer size because default is usually
                             # small (4k is common on Linux).
                             fh = open(filename, "wb", 131072)
                     else:
                         fd, filename = tempfile.mkstemp(prefix="hg-bundle-", suffix=".hg")
                         fh = os.fdopen(fd, pycompat.sysstr("wb"))
                     cleanup = filename
                     for c in chunks:
                         fh.write(c)
                     cleanup = None
                     return filename
                 finally:
                     if fh is not None:
                         fh.close()
                     if cleanup is not None:
                         if filename and vfs:
                             vfs.unlink(cleanup)
                         else:
                             os.unlink(cleanup)
             class cg1unpacker(object):
                 """Unpacker for cg1 changegroup streams.
                 A changegroup unpacker handles the framing of the revision data in
                 the wire format. Most consumers will want to use the apply()
                 method to add the changes from the changegroup to a repository.
                 If you're forwarding a changegroup unmodified to another consumer,
                 use getchunks(), which returns an iterator of changegroup
                 chunks. This is mostly useful for cases where you need to know the
                 data stream has ended by observing the end of the changegroup.
                 deltachunk() is useful only if you're applying delta data. Most
                 consumers should prefer apply() instead.
                 A few other public methods exist. Those are used only for
                 bundlerepo and some debug commands - their use is discouraged.
                 """
                 deltaheader = _CHANGEGROUPV1_DELTA_HEADER
                 deltaheadersize = struct.calcsize(deltaheader)
                 version = '01'
                 _grouplistcount = 1 # One list of files after the manifests
                 def __init__(self, fh, alg, extras=None):
                     if alg is None:
                         alg = 'UN'
                     if alg not in util.compengines.supportedbundletypes:
                         raise error.Abort(_('unknown stream compression type: %s')
                                          % alg)
                     if alg == 'BZ':
                         alg = '_truncatedBZ'
                     compengine = util.compengines.forbundletype(alg)
                     self._stream = compengine.decompressorreader(fh)
                     self._type = alg
                     self.extras = extras or {}
                     self.callback = None
                 # These methods (compressed, read, seek, tell) all appear to only
                 # be used by bundlerepo, but it's a little hard to tell.
                 def compressed(self):
                     return self._type is not None and self._type != 'UN'
                 def read(self, l):
                     return self._stream.read(l)
                 def seek(self, pos):
                     return self._stream.seek(pos)
                 def tell(self):
                     return self._stream.tell()
                 def close(self):
                     return self._stream.close()
                 def _chunklength(self):
                     d = readexactly(self._stream, 4)
                     l = struct.unpack(">l", d)[0]
                     if l <= 4:
                         if l:
                             raise error.Abort(_("invalid chunk length %d") % l)
                         return 0
                     if self.callback:
                         self.callback()
                     return l - 4
                 def changelogheader(self):
                     """v10 does not have a changelog header chunk"""
                     return {}
                 def manifestheader(self):
                     """v10 does not have a manifest header chunk"""
                     return {}
                 def filelogheader(self):
                     """return the header of the filelogs chunk, v10 only has the filename"""
                     l = self._chunklength()
                     if not l:
                         return {}
                     fname = readexactly(self._stream, l)
                     return {'filename': fname}
                 def _deltaheader(self, headertuple, prevnode):
                     node, p1, p2, cs = headertuple
                     if prevnode is None:
                         deltabase = p1
                     else:
                         deltabase = prevnode
                     flags = 0
                     return node, p1, p2, deltabase, cs, flags
                 def deltachunk(self, prevnode):
                     l = self._chunklength()
                     if not l:
                         return {}
                     headerdata = readexactly(self._stream, self.deltaheadersize)
                     header = struct.unpack(self.deltaheader, headerdata)
                     delta = readexactly(self._stream, l - self.deltaheadersize)
                     node, p1, p2, deltabase, cs, flags = self._deltaheader(header, prevnode)
                     return {'node': node, 'p1': p1, 'p2': p2, 'cs': cs,
                             'deltabase': deltabase, 'delta': delta, 'flags': flags}
                 def getchunks(self):
                     """returns all the chunks contains in the bundle
                     Used when you need to forward the binary stream to a file or another
                     network API. To do so, it parse the changegroup data, otherwise it will
                     block in case of sshrepo because it don't know the end of the stream.
                     """
                     # an empty chunkgroup is the end of the changegroup
                     # a changegroup has at least 2 chunkgroups (changelog and manifest).
                     # after that, changegroup versions 1 and 2 have a series of groups
                     # with one group per file. changegroup 3 has a series of directory
                     # manifests before the files.
                     count = 0
                     emptycount = 0
                     while emptycount < self._grouplistcount:
                         empty = True
                         count += 1
                         while True:
                             chunk = getchunk(self)
                             if not chunk:
                                 if empty and count > 2:
                                     emptycount += 1
                                 break
                             empty = False
                             yield chunkheader(len(chunk))
                             pos = 0
                             while pos < len(chunk):
                                 next = pos + 2**20
                                 yield chunk[pos:next]
                                 pos = next
                         yield closechunk()
                 def _unpackmanifests(self, repo, revmap, trp, prog, numchanges):
                     # We know that we'll never have more manifests than we had
                     # changesets.
                     self.callback = prog(_('manifests'), numchanges)
                     # no need to check for empty manifest group here:
                     # if the result of the merge of 1 and 2 is the same in 3 and 4,
                     # no new manifest will be created and the manifest group will
                     # be empty during the pull
                     self.manifestheader()
                     repo.manifestlog._revlog.addgroup(self, revmap, trp)
                     repo.ui.progress(_('manifests'), None)
                     self.callback = None
                 def apply(self, repo, tr, srctype, url, targetphase=phases.draft,
                           expectedtotal=None):
                     """Add the changegroup returned by source.read() to this repo.
                     srctype is a string like 'push', 'pull', or 'unbundle'.  url is
                     the URL of the repo where this changegroup is coming from.
                     Return an integer summarizing the change to this repo:
                     - nothing changed or no source: 0
                     - more heads than before: 1+added heads (2..n)
                     - fewer heads than before: -1-removed heads (-2..-n)
                     - number of heads stays the same: 1
                     """
                     repo = repo.unfiltered()
                     def csmap(x):
                         repo.ui.debug("add changeset %s\n" % short(x))
                         return len(cl)
                     def revmap(x):
                         return cl.rev(x)
                     changesets = files = revisions = 0
                     try:
                         # The transaction may already carry source information. In this
                         # case we use the top level data. We overwrite the argument
                         # because we need to use the top level value (if they exist)
                         # in this function.
                         srctype = tr.hookargs.setdefault('source', srctype)
                         url = tr.hookargs.setdefault('url', url)
                         repo.hook('prechangegroup', throw=True, **tr.hookargs)
                         # write changelog data to temp files so concurrent readers
                         # will not see an inconsistent view
                         cl = repo.changelog
                         cl.delayupdate(tr)
                         oldheads = set(cl.heads())
                         trp = weakref.proxy(tr)
                         # pull off the changeset group
                         repo.ui.status(_("adding changesets\n"))
                         clstart = len(cl)
                         class prog(object):
                             def __init__(self, step, total):
                                 self._step = step
                                 self._total = total
                                 self._count = 1
                             def __call__(self):
                                 repo.ui.progress(self._step, self._count, unit=_('chunks'),
                                                  total=self._total)
                                 self._count += 1
                         self.callback = prog(_('changesets'), expectedtotal)
                         efiles = set()
                         def onchangelog(cl, node):
                             efiles.update(cl.readfiles(node))
                         self.changelogheader()
                         cgnodes = cl.addgroup(self, csmap, trp, addrevisioncb=onchangelog)
                         efiles = len(efiles)
                         if not cgnodes:
                             repo.ui.develwarn('applied empty changegroup',
                                               config='empty-changegroup')
                         clend = len(cl)
                         changesets = clend - clstart
                         repo.ui.progress(_('changesets'), None)
                         self.callback = None
                         # pull off the manifest group
                         repo.ui.status(_("adding manifests\n"))
                         self._unpackmanifests(repo, revmap, trp, prog, changesets)
                         needfiles = {}
                         if repo.ui.configbool('server', 'validate'):
                             cl = repo.changelog
                             ml = repo.manifestlog
                             # validate incoming csets have their manifests
                             for cset in xrange(clstart, clend):
                                 mfnode = cl.changelogrevision(cset).manifest
                                 mfest = ml[mfnode].readdelta()
                                 # store file cgnodes we must see
                                 for f, n in mfest.iteritems():
                                     needfiles.setdefault(f, set()).add(n)
                         # process the files
                         repo.ui.status(_("adding file changes\n"))
                         newrevs, newfiles = _addchangegroupfiles(
                             repo, self, revmap, trp, efiles, needfiles)
                         revisions += newrevs
                         files += newfiles
                         deltaheads = 0
                         if oldheads:
                             heads = cl.heads()
                             deltaheads = len(heads) - len(oldheads)
                             for h in heads:
                                 if h not in oldheads and repo[h].closesbranch():
                                     deltaheads -= 1
                         htext = ""
                         if deltaheads:
                             htext = _(" (%+d heads)") % deltaheads
                         repo.ui.status(_("added %d changesets"
                                          " with %d changes to %d files%s\n")
                                          % (changesets, revisions, files, htext))
                         repo.invalidatevolatilesets()
                         if changesets > 0:
                             if 'node' not in tr.hookargs:
                                 tr.hookargs['node'] = hex(cl.node(clstart))
                                 tr.hookargs['node_last'] = hex(cl.node(clend - 1))
                                 hookargs = dict(tr.hookargs)
                             else:
                                 hookargs = dict(tr.hookargs)
                                 hookargs['node'] = hex(cl.node(clstart))
                                 hookargs['node_last'] = hex(cl.node(clend - 1))
                             repo.hook('pretxnchangegroup', throw=True, **hookargs)
                         added = [cl.node(r) for r in xrange(clstart, clend)]
+                        phaseall = None
                         if srctype in ('push', 'serve'):
                             # Old servers can not push the boundary themselves.
                             # New servers won't push the boundary if changeset already
                             # exists locally as secret
                             #
                             # We should not use added here but the list of all change in
                             # the bundle
                             if repo.publishing():
-                                phases.advanceboundary(repo, tr, phases.public, cgnodes)
+                                targetphase = phaseall = phases.public
                             else:
+                                # closer target phase computation
                                 # Those changesets have been pushed from the
                                 # outside, their phases are going to be pushed
                                 # alongside. Therefor `targetphase` is
                                 # ignored.
-                                phases.advanceboundary(repo, tr, phases.draft, cgnodes)
+                                targetphase = phaseall = phases.draft
-                                phases.retractboundary(repo, tr, phases.draft, added)
+                        if added:
-                        else:
+                            phases.registernew(repo, tr, targetphase, added)
-                            phases.retractboundary(repo, tr, targetphase, added)
+                        if phaseall is not None:
+                            phases.advanceboundary(repo, tr, phaseall, cgnodes)
                         if changesets > 0:
                             def runhooks():
                                 # These hooks run when the lock releases, not when the
                                 # transaction closes. So it's possible for the changelog
                                 # to have changed since we last saw it.
                                 if clstart >= len(repo):
                                     return
                                 repo.hook("changegroup", **hookargs)
                                 for n in added:
                                     args = hookargs.copy()
                                     args['node'] = hex(n)
                                     del args['node_last']
                                     repo.hook("incoming", **args)
                                 newheads = [h for h in repo.heads()
                                             if h not in oldheads]
                                 repo.ui.log("incoming",
                                             "%s incoming changes - new heads: %s\n",
                                             len(added),
                                             ', '.join([hex(c[:6]) for c in newheads]))
                             tr.addpostclose('changegroup-runhooks-%020i' % clstart,
                                             lambda tr: repo._afterlock(runhooks))
                     finally:
                         repo.ui.flush()
                     # never return 0 here:
                     if deltaheads < 0:
                         ret = deltaheads - 1
                     else:
                         ret = deltaheads + 1
                     return ret, added
             class cg2unpacker(cg1unpacker):
                 """Unpacker for cg2 streams.
                 cg2 streams add support for generaldelta, so the delta header
                 format is slightly different. All other features about the data
                 remain the same.
                 """
                 deltaheader = _CHANGEGROUPV2_DELTA_HEADER
                 deltaheadersize = struct.calcsize(deltaheader)
                 version = '02'
                 def _deltaheader(self, headertuple, prevnode):
                     node, p1, p2, deltabase, cs = headertuple
                     flags = 0
                     return node, p1, p2, deltabase, cs, flags
             class cg3unpacker(cg2unpacker):
                 """Unpacker for cg3 streams.
                 cg3 streams add support for exchanging treemanifests and revlog
                 flags. It adds the revlog flags to the delta header and an empty chunk
                 separating manifests and files.
                 """
                 deltaheader = _CHANGEGROUPV3_DELTA_HEADER
                 deltaheadersize = struct.calcsize(deltaheader)
                 version = '03'
                 _grouplistcount = 2 # One list of manifests and one list of files
                 def _deltaheader(self, headertuple, prevnode):
                     node, p1, p2, deltabase, cs, flags = headertuple
                     return node, p1, p2, deltabase, cs, flags
                 def _unpackmanifests(self, repo, revmap, trp, prog, numchanges):
                     super(cg3unpacker, self)._unpackmanifests(repo, revmap, trp, prog,
                                                               numchanges)
                     for chunkdata in iter(self.filelogheader, {}):
                         # If we get here, there are directory manifests in the changegroup
                         d = chunkdata["filename"]
                         repo.ui.debug("adding %s revisions\n" % d)
                         dirlog = repo.manifestlog._revlog.dirlog(d)
                         if not dirlog.addgroup(self, revmap, trp):
                             raise error.Abort(_("received dir revlog group is empty"))
             class headerlessfixup(object):
                 def __init__(self, fh, h):
                     self._h = h
                     self._fh = fh
                 def read(self, n):
                     if self._h:
                         d, self._h = self._h[:n], self._h[n:]
                         if len(d) < n:
                             d += readexactly(self._fh, n - len(d))
                         return d
                     return readexactly(self._fh, n)
             class cg1packer(object):
                 deltaheader = _CHANGEGROUPV1_DELTA_HEADER
                 version = '01'
                 def __init__(self, repo, bundlecaps=None):
                     """Given a source repo, construct a bundler.
                     bundlecaps is optional and can be used to specify the set of
                     capabilities which can be used to build the bundle. While bundlecaps is
                     unused in core Mercurial, extensions rely on this feature to communicate
                     capabilities to customize the changegroup packer.
                     """
                     # Set of capabilities we can use to build the bundle.
                     if bundlecaps is None:
                         bundlecaps = set()
                     self._bundlecaps = bundlecaps
                     # experimental config: bundle.reorder
                     reorder = repo.ui.config('bundle', 'reorder')
                     if reorder == 'auto':
                         reorder = None
                     else:
                         reorder = util.parsebool(reorder)
                     self._repo = repo
                     self._reorder = reorder
                     self._progress = repo.ui.progress
                     if self._repo.ui.verbose and not self._repo.ui.debugflag:
                         self._verbosenote = self._repo.ui.note
                     else:
                         self._verbosenote = lambda s: None
                 def close(self):
                     return closechunk()
                 def fileheader(self, fname):
                     return chunkheader(len(fname)) + fname
                 # Extracted both for clarity and for overriding in extensions.
                 def _sortgroup(self, revlog, nodelist, lookup):
                     """Sort nodes for change group and turn them into revnums."""
                     # for generaldelta revlogs, we linearize the revs; this will both be
                     # much quicker and generate a much smaller bundle
                     if (revlog._generaldelta and self._reorder is None) or self._reorder:
                         dag = dagutil.revlogdag(revlog)
                         return dag.linearize(set(revlog.rev(n) for n in nodelist))
                     else:
                         return sorted([revlog.rev(n) for n in nodelist])
                 def group(self, nodelist, revlog, lookup, units=None):
                     """Calculate a delta group, yielding a sequence of changegroup chunks
                     (strings).
                     Given a list of changeset revs, return a set of deltas and
                     metadata corresponding to nodes. The first delta is
                     first parent(nodelist[0]) -> nodelist[0], the receiver is
                     guaranteed to have this parent as it has all history before
                     these changesets. In the case firstparent is nullrev the
                     changegroup starts with a full revision.
                     If units is not None, progress detail will be generated, units specifies
                     the type of revlog that is touched (changelog, manifest, etc.).
                     """
                     # if we don't have any revisions touched by these changesets, bail
                     if len(nodelist) == 0:
                         yield self.close()
                         return
                     revs = self._sortgroup(revlog, nodelist, lookup)
                     # add the parent of the first rev
                     p = revlog.parentrevs(revs[0])[0]
                     revs.insert(0, p)
                     # build deltas
                     total = len(revs) - 1
                     msgbundling = _('bundling')
                     for r in xrange(len(revs) - 1):
                         if units is not None:
                             self._progress(msgbundling, r + 1, unit=units, total=total)
                         prev, curr = revs[r], revs[r + 1]
                         linknode = lookup(revlog.node(curr))
                         for c in self.revchunk(revlog, curr, prev, linknode):
                             yield c
                     if units is not None:
                         self._progress(msgbundling, None)
                     yield self.close()
                 # filter any nodes that claim to be part of the known set
                 def prune(self, revlog, missing, commonrevs):
                     rr, rl = revlog.rev, revlog.linkrev
                     return [n for n in missing if rl(rr(n)) not in commonrevs]
                 def _packmanifests(self, dir, mfnodes, lookuplinknode):
                     """Pack flat manifests into a changegroup stream."""
                     assert not dir
                     for chunk in self.group(mfnodes, self._repo.manifestlog._revlog,
                                             lookuplinknode, units=_('manifests')):
                         yield chunk
                 def _manifestsdone(self):
                     return ''
                 def generate(self, commonrevs, clnodes, fastpathlinkrev, source):
                     '''yield a sequence of changegroup chunks (strings)'''
                     repo = self._repo
                     cl = repo.changelog
                     clrevorder = {}
                     mfs = {} # needed manifests
                     fnodes = {} # needed file nodes
                     changedfiles = set()
                     # Callback for the changelog, used to collect changed files and manifest
                     # nodes.
                     # Returns the linkrev node (identity in the changelog case).
                     def lookupcl(x):
                         c = cl.read(x)
                         clrevorder[x] = len(clrevorder)
                         n = c[0]
                         # record the first changeset introducing this manifest version
                         mfs.setdefault(n, x)
                         # Record a complete list of potentially-changed files in
                         # this manifest.
                         changedfiles.update(c[3])
                         return x
                     self._verbosenote(_('uncompressed size of bundle content:\n'))
                     size = 0
                     for chunk in self.group(clnodes, cl, lookupcl, units=_('changesets')):
                         size += len(chunk)
                         yield chunk
                     self._verbosenote(_('%8.i (changelog)\n') % size)
                     # We need to make sure that the linkrev in the changegroup refers to
                     # the first changeset that introduced the manifest or file revision.
                     # The fastpath is usually safer than the slowpath, because the filelogs
                     # are walked in revlog order.
                     #
                     # When taking the slowpath with reorder=None and the manifest revlog
                     # uses generaldelta, the manifest may be walked in the "wrong" order.
                     # Without 'clrevorder', we would get an incorrect linkrev (see fix in
                     # cc0ff93d0c0c).
                     #
                     # When taking the fastpath, we are only vulnerable to reordering
                     # of the changelog itself. The changelog never uses generaldelta, so
                     # it is only reordered when reorder=True. To handle this case, we
                     # simply take the slowpath, which already has the 'clrevorder' logic.
                     # This was also fixed in cc0ff93d0c0c.
                     fastpathlinkrev = fastpathlinkrev and not self._reorder
                     # Treemanifests don't work correctly with fastpathlinkrev
                     # either, because we don't discover which directory nodes to
                     # send along with files. This could probably be fixed.
                     fastpathlinkrev = fastpathlinkrev and (
                         'treemanifest' not in repo.requirements)
                     for chunk in self.generatemanifests(commonrevs, clrevorder,
                             fastpathlinkrev, mfs, fnodes):
                         yield chunk
                     mfs.clear()
                     clrevs = set(cl.rev(x) for x in clnodes)
                     if not fastpathlinkrev:
                         def linknodes(unused, fname):
                             return fnodes.get(fname, {})
                     else:
                         cln = cl.node
                         def linknodes(filerevlog, fname):
                             llr = filerevlog.linkrev
                             fln = filerevlog.node
                             revs = ((r, llr(r)) for r in filerevlog)
                             return dict((fln(r), cln(lr)) for r, lr in revs if lr in clrevs)
                     for chunk in self.generatefiles(changedfiles, linknodes, commonrevs,
                                                     source):
                         yield chunk
                     yield self.close()
                     if clnodes:
                         repo.hook('outgoing', node=hex(clnodes[0]), source=source)
                 def generatemanifests(self, commonrevs, clrevorder, fastpathlinkrev, mfs,
                                       fnodes):
                     repo = self._repo
                     mfl = repo.manifestlog
                     dirlog = mfl._revlog.dirlog
                     tmfnodes = {'': mfs}
                     # Callback for the manifest, used to collect linkrevs for filelog
                     # revisions.
                     # Returns the linkrev node (collected in lookupcl).
                     def makelookupmflinknode(dir):
                         if fastpathlinkrev:
                             assert not dir
                             return mfs.__getitem__
                         def lookupmflinknode(x):
                             """Callback for looking up the linknode for manifests.
                             Returns the linkrev node for the specified manifest.
                             SIDE EFFECT:
 ) fclnodes gets populated with the list of relevant
                                file nodes if we're not using fastpathlinkrev
 ) When treemanifests are in use, collects treemanifest nodes
                                to send
                             Note that this means manifests must be completely sent to
                             the client before you can trust the list of files and
                             treemanifests to send.
                             """
                             clnode = tmfnodes[dir][x]
                             mdata = mfl.get(dir, x).readfast(shallow=True)
                             for p, n, fl in mdata.iterentries():
                                 if fl == 't': # subdirectory manifest
                                     subdir = dir + p + '/'
                                     tmfclnodes = tmfnodes.setdefault(subdir, {})
                                     tmfclnode = tmfclnodes.setdefault(n, clnode)
                                     if clrevorder[clnode] < clrevorder[tmfclnode]:
                                         tmfclnodes[n] = clnode
                                 else:
                                     f = dir + p
                                     fclnodes = fnodes.setdefault(f, {})
                                     fclnode = fclnodes.setdefault(n, clnode)
                                     if clrevorder[clnode] < clrevorder[fclnode]:
                                         fclnodes[n] = clnode
                             return clnode
                         return lookupmflinknode
                     size = 0
                     while tmfnodes:
                         dir = min(tmfnodes)
                         nodes = tmfnodes[dir]
                         prunednodes = self.prune(dirlog(dir), nodes, commonrevs)
                         if not dir or prunednodes:
                             for x in self._packmanifests(dir, prunednodes,
                                                          makelookupmflinknode(dir)):
                                 size += len(x)
                                 yield x
                         del tmfnodes[dir]
                     self._verbosenote(_('%8.i (manifests)\n') % size)
                     yield self._manifestsdone()
                 # The 'source' parameter is useful for extensions
                 def generatefiles(self, changedfiles, linknodes, commonrevs, source):
                     repo = self._repo
                     progress = self._progress
                     msgbundling = _('bundling')
                     total = len(changedfiles)
                     # for progress output
                     msgfiles = _('files')
                     for i, fname in enumerate(sorted(changedfiles)):
                         filerevlog = repo.file(fname)
                         if not filerevlog:
                             raise error.Abort(_("empty or missing revlog for %s") % fname)
                         linkrevnodes = linknodes(filerevlog, fname)
                         # Lookup for filenodes, we collected the linkrev nodes above in the
                         # fastpath case and with lookupmf in the slowpath case.
                         def lookupfilelog(x):
                             return linkrevnodes[x]
                         filenodes = self.prune(filerevlog, linkrevnodes, commonrevs)
                         if filenodes:
                             progress(msgbundling, i + 1, item=fname, unit=msgfiles,
                                      total=total)
                             h = self.fileheader(fname)
                             size = len(h)
                             yield h
                             for chunk in self.group(filenodes, filerevlog, lookupfilelog):
                                 size += len(chunk)
                                 yield chunk
                             self._verbosenote(_('%8.i  %s\n') % (size, fname))
                     progress(msgbundling, None)
                 def deltaparent(self, revlog, rev, p1, p2, prev):
                     return prev
                 def revchunk(self, revlog, rev, prev, linknode):
                     node = revlog.node(rev)
                     p1, p2 = revlog.parentrevs(rev)
                     base = self.deltaparent(revlog, rev, p1, p2, prev)
                     prefix = ''
                     if revlog.iscensored(base) or revlog.iscensored(rev):
                         try:
                             delta = revlog.revision(node, raw=True)
                         except error.CensoredNodeError as e:
                             delta = e.tombstone
                         if base == nullrev:
                             prefix = mdiff.trivialdiffheader(len(delta))
                         else:
                             baselen = revlog.rawsize(base)
                             prefix = mdiff.replacediffheader(baselen, len(delta))
                     elif base == nullrev:
                         delta = revlog.revision(node, raw=True)
                         prefix = mdiff.trivialdiffheader(len(delta))
                     else:
                         delta = revlog.revdiff(base, rev)
                     p1n, p2n = revlog.parents(node)
                     basenode = revlog.node(base)
                     flags = revlog.flags(rev)
                     meta = self.builddeltaheader(node, p1n, p2n, basenode, linknode, flags)
                     meta += prefix
                     l = len(meta) + len(delta)
                     yield chunkheader(l)
                     yield meta
                     yield delta
                 def builddeltaheader(self, node, p1n, p2n, basenode, linknode, flags):
                     # do nothing with basenode, it is implicitly the previous one in HG10
                     # do nothing with flags, it is implicitly 0 for cg1 and cg2
                     return struct.pack(self.deltaheader, node, p1n, p2n, linknode)
             class cg2packer(cg1packer):
                 version = '02'
                 deltaheader = _CHANGEGROUPV2_DELTA_HEADER
                 def __init__(self, repo, bundlecaps=None):
                     super(cg2packer, self).__init__(repo, bundlecaps)
                     if self._reorder is None:
                         # Since generaldelta is directly supported by cg2, reordering
                         # generally doesn't help, so we disable it by default (treating
                         # bundle.reorder=auto just like bundle.reorder=False).
                         self._reorder = False
                 def deltaparent(self, revlog, rev, p1, p2, prev):
                     dp = revlog.deltaparent(rev)
                     if dp == nullrev and revlog.storedeltachains:
                         # Avoid sending full revisions when delta parent is null. Pick prev
                         # in that case. It's tempting to pick p1 in this case, as p1 will
                         # be smaller in the common case. However, computing a delta against
                         # p1 may require resolving the raw text of p1, which could be
                         # expensive. The revlog caches should have prev cached, meaning
                         # less CPU for changegroup generation. There is likely room to add
                         # a flag and/or config option to control this behavior.
                         return prev
                     elif dp == nullrev:
                         # revlog is configured to use full snapshot for a reason,
                         # stick to full snapshot.
                         return nullrev
                     elif dp not in (p1, p2, prev):
                         # Pick prev when we can't be sure remote has the base revision.
                         return prev
                     else:
                         return dp
                 def builddeltaheader(self, node, p1n, p2n, basenode, linknode, flags):
                     # Do nothing with flags, it is implicitly 0 in cg1 and cg2
                     return struct.pack(self.deltaheader, node, p1n, p2n, basenode, linknode)
             class cg3packer(cg2packer):
                 version = '03'
                 deltaheader = _CHANGEGROUPV3_DELTA_HEADER
                 def _packmanifests(self, dir, mfnodes, lookuplinknode):
                     if dir:
                         yield self.fileheader(dir)
                     dirlog = self._repo.manifestlog._revlog.dirlog(dir)
                     for chunk in self.group(mfnodes, dirlog, lookuplinknode,
                                             units=_('manifests')):
                         yield chunk
                 def _manifestsdone(self):
                     return self.close()
                 def builddeltaheader(self, node, p1n, p2n, basenode, linknode, flags):
                     return struct.pack(
                         self.deltaheader, node, p1n, p2n, basenode, linknode, flags)
             _packermap = {'01': (cg1packer, cg1unpacker),
                          # cg2 adds support for exchanging generaldelta
                          '02': (cg2packer, cg2unpacker),
                          # cg3 adds support for exchanging revlog flags and treemanifests
                          '03': (cg3packer, cg3unpacker),
             }
             def allsupportedversions(repo):
                 versions = set(_packermap.keys())
                 if not (repo.ui.configbool('experimental', 'changegroup3') or
                         repo.ui.configbool('experimental', 'treemanifest') or
                         'treemanifest' in repo.requirements):
                     versions.discard('03')
                 return versions
             # Changegroup versions that can be applied to the repo
             def supportedincomingversions(repo):
                 return allsupportedversions(repo)
             # Changegroup versions that can be created from the repo
             def supportedoutgoingversions(repo):
                 versions = allsupportedversions(repo)
                 if 'treemanifest' in repo.requirements:
                     # Versions 01 and 02 support only flat manifests and it's just too
                     # expensive to convert between the flat manifest and tree manifest on
                     # the fly. Since tree manifests are hashed differently, all of history
                     # would have to be converted. Instead, we simply don't even pretend to
                     # support versions 01 and 02.
                     versions.discard('01')
                     versions.discard('02')
                 return versions
             def safeversion(repo):
                 # Finds the smallest version that it's safe to assume clients of the repo
                 # will support. For example, all hg versions that support generaldelta also
                 # support changegroup 02.
                 versions = supportedoutgoingversions(repo)
                 if 'generaldelta' in repo.requirements:
                     versions.discard('01')
                 assert versions
                 return min(versions)
             def getbundler(version, repo, bundlecaps=None):
                 assert version in supportedoutgoingversions(repo)
                 return _packermap[version][0](repo, bundlecaps)
             def getunbundler(version, fh, alg, extras=None):
                 return _packermap[version][1](fh, alg, extras=extras)
             def _changegroupinfo(repo, nodes, source):
                 if repo.ui.verbose or source == 'bundle':
                     repo.ui.status(_("%d changesets found\n") % len(nodes))
                 if repo.ui.debugflag:
                     repo.ui.debug("list of changesets:\n")
                     for node in nodes:
                         repo.ui.debug("%s\n" % hex(node))
             def getsubsetraw(repo, outgoing, bundler, source, fastpath=False):
                 repo = repo.unfiltered()
                 commonrevs = outgoing.common
                 csets = outgoing.missing
                 heads = outgoing.missingheads
                 # We go through the fast path if we get told to, or if all (unfiltered
                 # heads have been requested (since we then know there all linkrevs will
                 # be pulled by the client).
                 heads.sort()
                 fastpathlinkrev = fastpath or (
                         repo.filtername is None and heads == sorted(repo.heads()))
                 repo.hook('preoutgoing', throw=True, source=source)
                 _changegroupinfo(repo, csets, source)
                 return bundler.generate(commonrevs, csets, fastpathlinkrev, source)
             def getsubset(repo, outgoing, bundler, source, fastpath=False):
                 gengroup = getsubsetraw(repo, outgoing, bundler, source, fastpath)
                 return getunbundler(bundler.version, util.chunkbuffer(gengroup), None,
                                     {'clcount': len(outgoing.missing)})
             def changegroupsubset(repo, roots, heads, source, version='01'):
                 """Compute a changegroup consisting of all the nodes that are
                 descendants of any of the roots and ancestors of any of the heads.
                 Return a chunkbuffer object whose read() method will return
                 successive changegroup chunks.
                 It is fairly complex as determining which filenodes and which
                 manifest nodes need to be included for the changeset to be complete
                 is non-trivial.
                 Another wrinkle is doing the reverse, figuring out which changeset in
                 the changegroup a particular filenode or manifestnode belongs to.
                 """
                 outgoing = discovery.outgoing(repo, missingroots=roots, missingheads=heads)
                 bundler = getbundler(version, repo)
                 return getsubset(repo, outgoing, bundler, source)
             def getlocalchangegroupraw(repo, source, outgoing, bundlecaps=None,
                                        version='01'):
                 """Like getbundle, but taking a discovery.outgoing as an argument.
                 This is only implemented for local repos and reuses potentially
                 precomputed sets in outgoing. Returns a raw changegroup generator."""
                 if not outgoing.missing:
                     return None
                 bundler = getbundler(version, repo, bundlecaps)
                 return getsubsetraw(repo, outgoing, bundler, source)
             def getchangegroup(repo, source, outgoing, bundlecaps=None,
                                version='01'):
                 """Like getbundle, but taking a discovery.outgoing as an argument.
                 This is only implemented for local repos and reuses potentially
                 precomputed sets in outgoing."""
                 if not outgoing.missing:
                     return None
                 bundler = getbundler(version, repo, bundlecaps)
                 return getsubset(repo, outgoing, bundler, source)
             def getlocalchangegroup(repo, *args, **kwargs):
                 repo.ui.deprecwarn('getlocalchangegroup is deprecated, use getchangegroup',
                                    '4.3')
                 return getchangegroup(repo, *args, **kwargs)
             def changegroup(repo, basenodes, source):
                 # to avoid a race we use changegroupsubset() (issue1320)
                 return changegroupsubset(repo, basenodes, repo.heads(), source)
             def _addchangegroupfiles(repo, source, revmap, trp, expectedfiles, needfiles):
                 revisions = 0
                 files = 0
                 for chunkdata in iter(source.filelogheader, {}):
                     files += 1
                     f = chunkdata["filename"]
                     repo.ui.debug("adding %s revisions\n" % f)
                     repo.ui.progress(_('files'), files, unit=_('files'),
                                      total=expectedfiles)
                     fl = repo.file(f)
                     o = len(fl)
                     try:
                         if not fl.addgroup(source, revmap, trp):
                             raise error.Abort(_("received file revlog group is empty"))
                     except error.CensoredBaseError as e:
                         raise error.Abort(_("received delta base is censored: %s") % e)
                     revisions += len(fl) - o
                     if f in needfiles:
                         needs = needfiles[f]
                         for new in xrange(o, len(fl)):
                             n = fl.node(new)
                             if n in needs:
                                 needs.remove(n)
                             else:
                                 raise error.Abort(
                                     _("received spurious file revlog entry"))
                         if not needs:
                             del needfiles[f]
                 repo.ui.progress(_('files'), None)
                 for f, needs in needfiles.iteritems():
                     fl = repo.file(f)
                     for n in needs:
                         try:
                             fl.rev(n)
                         except error.LookupError:
                             raise error.Abort(
                                 _('missing file data for %s:%s - run hg verify') %
                                 (f, hex(n)))
                 return revisions, files